pii_redaction_standard:尝试制定PII编辑标准 源码
pii_redaction_standard 尝试为PII编辑制定标准。 概述 从记者到科学家再到医学专家,许多不同的人和组织都需要共享可能包含PII(个人识别信息)的敏感数据。 通常,这些数据是经过编辑的,但是这样做的标准工具集很少,也没有标准的测试集来验证那些工具或任何新工具的可靠性。 该存储库旨在通过提供以下内容为此奠定基础: 广义解释的PII定义可用于确定... 一组用于不同类型的PII的示例,用于测试... 一个用于在文本文档中查找该PII的库。 该存储库的目的不是完整或全面,并不涵盖所有可能的PII,也不涵盖可能包含PII的所有文档。 相反,它尝试提供良好的首次尝试,可以用作进一步扩展的参考点。 开放和同行评审的必要性 我们认为,像这样的工作要公开进行,并且要经过同行的审查,这对于防止编校成为炼金术很重要。 我们可能拥有有用的修订技术,但并非万无一失,当务之急是因为不
下载地址
用户评论