# 故障定位

主要是毕设的故障定位相关知识，主要包含的章节有故障定位基本概念、相关论文的阅读

# 基本概念

# 错误模型

# 论文1--DeepLocalize Fault Localization for Deep Neural

深度神经网络(dnn)正在成为大多数软件系统不可或缺的一部分。之前的研究表明，深度神经网络存在缺陷。不幸的是，由于缺乏对模型行为的理解，现有的调试技术不支持定位DNN错误。整个DNN模型呈现为一个黑盒子。为了解决这些问题，我们提出了一种方法和工具，可以自动确定模型是否存在错误，并识别DNN错误的根本原因。我们的关键见解是，可以分析在层之间传播的值的历史趋势，以识别故障，并定位故障。为此，我们首先启用深度学习应用程序的动态分析:将其转换为命令式表示，或者使用回调机制。这两种机制都允许我们插入探针，当DNN在训练数据上进行训练时，可以对DNN产生的痕迹进行动态分析。然后，我们对轨迹进行动态分析，以识别导致错误的故障层或超参数。我们提出了一种识别根本原因的算法，该算法通过捕获任何数值误差和在训练过程中监测模型，并找到DNN结果上每个层/参数的相关性。

# 论文2--Symbolic Execution for Importance Analysis and Adversarial Generation in Neural Networks

深度神经网络(DNN)越来越多地应用于各种应用中，其中许多应用具有严重的安全性和安全性问题。本文描述了DeepCheck，这是一种基于程序分析(特别是符号执行)的核心思想来验证dnn的新方法。DeepCheck实现了DNN轻量级符号分析的新技术，并将其应用于解决DNN分析中的两个具有挑战性的问题:1)识别重要的输入特征，2)利用这些特征创建对抗性输入。使用MNIST图像分类网络和文本数据情感网络进行的实验结果表明，DeepCheck有望成为深度神经网络分析的一个有价值的工具。

# 论文3--An Empirical Study of Common Challenges in Developing Deep Learning Applications

深度学习应用于许多智能系统和应用的创新，但在构建深度学习应用程序时通常面临哪些挑战，仍然没有得到充分的研究。为了寻找答案，本文对一个流行的问答网站Stack Overflow上的深度学习问题进行了大规模的实证研究。手动检查715个问题的样本，确定了7种常见问题，进一步建立一个分类模型来量化不同类型的深度学习问题在整个39628个深度学习问题集中的分布。发现程序崩溃、模型迁移和实现问题是最常被问到的三个问题。在仔细检查了这些问题的公认答案后，总结了可能值得研究界关注的五个主要根本原因，包括API滥用，不正确的超参数选择，GPU计算，静态图形计算以及有限的调试和分析支持。研究结果强调了对跨框架差分测试等新技术的需求，以提高深度学习中的软件开发效率和软件可靠性。

# 论文4--An Empirical Study on TensorFlow Program Bugs∗

有缺陷的深度学习应用可能会导致灾难性的后果，虽然最近对深度学习应用的测试和调试进行了大量的研究，但深度学习缺陷的特征却从未被研究过。为填补所有这些差距，研究建立在TensorFlow之上的深度学习应用程序，并从StackOver Flow的QA页面和Github项目中收集了与TensorFlow相关的程序错误。从QA页面中提取信息、提交消息、提取请求消息并发布讨论，以检查这些bug的根本原因和症状。同时研究TensorFlow用户部署的错误检测和定位策略。这些发现有助于研究人员和TensorFlow用户更好地理解TensorFlow程序中的编码缺陷，并为未来的研究指明了新的方向

← 神经网络论文研究 →