1. 首页
  2. 数据库
  3. 其它
  4. tei_reader:TEI Reader Python库 源码

tei_reader:TEI Reader Python库 源码

上传者: 2021-04-24 21:54:31上传 ZIP文件 127KB 热度 19次
用于读取TEI P5(精简版)文件的文本内容和元数据的Python 3库 该库专注于从文件中提取主要文本内容,并提供有关文本的可用元数据。 TL; DR pip install tei-reader from tei_reader import TeiReader reader = TeiReader () corpora = reader . read_file ( 'example-tei.xml' ) # or read_string print ( corpora . text ) # show element attributes before the actual element text print ( corpora . tostring ( lambda x , text : str ( list ( a . key + '=' + a . text for a in
用户评论