乐观墨镜

文章
4
资源
0
加入时间
3年1月10天

python提取国家和地区信息

因实验需要,需要在文本中提取出地区信息,也算是 NER 中的一部分。在经过查阅后,基本上都是推荐 geotext 或者 geograpy3 工具包,或者使用数据库自己匹配。都有缺点吧,geotext 据说 USA 这样的缩写也识别不出来。在这里的话,我自己是推荐 flashgeotext ,经过实验,是可以识别出 USA, US 这种缩写的。缺点也有,识别不了中文,还好我处理的都是英文数据集。from flashgeotext.geotext import GeoTextimport jsong