鲤鱼钢笔

文章
3
资源
0
加入时间
3年0月9天

[NLP工程项目实战:用NLP解决工程造价文本难题] (1) 开篇及文本特点探索问题背景我们的想法启动:文本特点探索(1)附上清单名称文本提取的代码附上清单名称文本长度探索代码

问题背景工程造价属于工程行业的一个分支,主要确定一个工程的造价构成,通过算量和计价软件,生成一个工程的详细造价构成。造价清单,是构成造价的最小元素。一条清单的重要文本包含清单名称、清单特征、套用的N条定额。N条定额中包含详细材料列表。名称(简称A)、特征(简称B)、材料(简称C)被称为清单的三个要素,简称为清单三要素。一个总造价几个亿的工程,通常由几千条清单构成,造价工程师需要很长的时间来完成这份造价。由于清单数量众多,经常发生清单三要素不一致的人为错误。例如A中写的是“商品混凝土C30”,B中