我们的预测基于哪些因素?

预测分数是在面板中对每个学生确定的分数、介于 0 和 1 之间。分数越接近 1、越可能有需要调查的内容。它使用 Turnitin 的预测算法进行计算、此算法使用自然语言处理 (NLP) 方法。

NLP 是人工智能的一个子领域、专注于使计算机能够理解和处理人类语言、使计算机更接近人类对语言的理解。

那么它是如何运行的?

我们为此算法提供了一个大型文档数据集、我们知道这些文档是在线购买的、并指示它分析数百个语言特征。这将训练算法了解要在文档中查找的内容。

这些语言特征通常过于复杂、不能以有价值的数据形式来呈现。出于这个原因、我们将其合并成一个我们对学生确定的分数。这个分数是真实且易于理解的

这个分数准确吗?

我们的准确性目标基于迪肯大学所做的一项研究、此研究的主题是指示标记器查找合同欺诈时、标记器识别合同欺诈的效果如何。在这项研究中、他们在识别合同欺诈方面达到了 62% 的敏感度。根据我们的预测算法验证、我们的算法经过调整、在识别不同作者时具有相同 的灵敏度(检测率)。

您和其他机构对调查员使用作者身份的次数越多、预测模型的效果会更好。

我们从不声称学生有合同欺诈行为、我们只是建议进行进一步调查。应由调查员来确定是否有足够的证据来提出合同欺诈指控。