1. 首页
  2. 编程语言
  3. Python
  4. jieba分词支持关键词带空格和特殊字符
用户评论
码姐姐匿名网友 2018-12-09 20:21:19

这也要五分。。。。我的天啊

码姐姐匿名网友 2018-12-09 20:21:19

还可以,只是在原有jieba分词的基础上修改了__init__.py的第37行 #re_userdict = re.compile('^(.+?)( [0-9]+)?( [a-z]+)?$', re.U) re_userdict = re.compile('^(.+?)(\u0040\u0040[0-9]+)?(\u0040\u0040[a-z]+)?$', re.U) 和44行 #re_han_default = re.compile("([\u4E00-\u9FD5a-zA-Z0-9+#&\._]+)", re.U) re_han_default = re.co

码姐姐匿名网友 2018-12-09 20:21:19

还可以吧,github上也有