忧郁大叔

文章
8
资源
0
加入时间
2年10月17天

处理文本数据的一些思路

文本是最常用的序列数据之一,可以理解为字符序列或单词序列,但最常见的是单词级处理。深度学习序列处理模型都可以根据文本生成基本形式的自然语言理解,并可用于文档分类、情感分析、作者识别甚至问答(QA,在有限的语境下)等应用。当然,目前我所接触的这些深度学习模型都没有像人类一样真正地理解文本,而只是映射出书面语言的统计结构,但这足以解决许多简单的文本任务。

Python yacs库

yacs是一个python库,用于定义和管理系统配置,比如那些通常可以在为科学实验设计的软件中找到的配置。这些“配置”通常包括用于训练机器学习模型的超参数

DMC FZ-28 拍荷花

趁着今天天气好,和Hitechor到紫竹院拍了一组荷花的照片。拍摄时的设置为:[size=medium][color=red]A档,大光圈,点测光,点对焦,对比度、锐度和饱和度+2。拍的时候对荷花进行测光,曝光补偿一般设置为-1/3 或 -2/3。[/color][/size]下面的照片没有经过处理,只是将图片大小压缩裁剪。新手拍照片,请大家多提宝贵意见。[img]/u...