1. 首页
  2. 数据库
  3. 其它
  4. 语言检测神经网络 源码

语言检测神经网络 源码

上传者: 2021-02-22 17:07:37上传 ZIP文件 9.38MB 热度 9次
语言检测神经网络 在数据处理中,我使用了大小为510的向量。前255个索引用于存储1-ngram,其余索引用于存储3-gram。 我假设1克可以帮助识别字母(西里尔语,拉丁语等),而3克可以帮助识别同一字母内的语言。 激活函数SoftMax输出0到1之间的数字,这就是为什么矢量值在该范围内被标准化的原因。 层数的增加导致神经网络“学习”的时间增加。 而且,在最初的两次迭代中下降之后的错误率开始增加。 辍学率提高了准确性,但幅度不大(≈2-5%)。 我为自己得出的结论是,配置网络本身(尝试使用不同的激活功能,层数等)并没有多大帮助(也许只是个小数点),只有数据准备才是真正重要的。
用户评论