tei_reader:TEI Reader Python库 源码
用于读取TEI P5(精简版)文件的文本内容和元数据的Python 3库 该库专注于从文件中提取主要文本内容,并提供有关文本的可用元数据。 TL; DR pip install tei-reader from tei_reader import TeiReader reader = TeiReader () corpora = reader . read_file ( 'example-tei.xml' ) # or read_string print ( corpora . text ) # show element attributes before the actual element text print ( corpora . tostring ( lambda x , text : str ( list ( a . key + '=' + a . text for a in
用户评论