博海文思


SkyHigh

自然语言处理——句法分析

Previous 自然语言处理——语言模型 自然语言处理——词法分析与词性标注 自然语言处理——语法分析 自然语言处理——句法分析 任务 识别句子的句法结构 分类 短语结构分析(完全句法分析、局部句法分析)、依存句法分析 目标 正确性、鲁棒性 问题 句子歧义性(结构歧...

自然语言处理——语法分析

Previous 自然语言处理——语言模型 自然语言处理——词法分析与词性标注 语法分析 语法分析包括句法分析和词法分析。 4类形式语法:短语文法、上下文有关文法、上下文无关文法、正规文法 管辖和约束理论(GB) 词汇功能语法(LFG):考虑句子成分结构层次和功能(主要指...

自然语言处理——词法分析与词性标注

Previous 自然语言处理——语言模型 自然语言处理——词法分析与词性标注 英语的词法分析(形态分析) 单词识别:词缩写的恢复,如I’ll -> I will 形态还原(分析):还原词的初始形态。如果在词典中,则直接识别;如果不在,则用规则对词进行还原;如果无法匹配...

自然语言处理——语言模型

自然语言处理——语言模型 前言 最近又重拾了宗成庆老师的《统计自然语言处理》一书,距离上次看这本书已经过去了一年有余。而上个学期大部分时间都投入到深度学习相关的内容中了,所以一直拖到现在(当然,并不是因为闲下来了……)。 这本书算是我的自然语言处理入门之作,里面讲解的都是传统的统计计算语...

KMP算法与AC自动机

KMP算法与AC自动机 KMP算法——用于单模匹配。 AC自动机——用于多模匹配,需要了解KMP原理和Trie树。 KMP算法 KMP算法用于单模匹配,比如在一个目标串当中匹配一个模式串。暴力解法就是扫描目标串与模式串,如果发现不匹配,则目标串起始点回溯到原起始点,再后移一位,而模式串回...

C/C++常见问题汇总(不定期更新)

C/C++常见问题汇总(不定期更新) 1. memset只能对int数组初始化为0或-1 memset只能够用来初始化char数组,而对int数组,则只会初始化0或-1。 原因是memset是一个字节一个字节的初始化的。 char是一个字节,而int一般是4个字节。 对于0,表示为 0x...

《Machine Learning Yearning》读记

《Machine Learning Yearning》读记 难得一口气看完一本英文书(主要是篇幅短,哈哈哈)。这本书不是旨在讲授高深的机器学习原理和复杂的推导,而是讲机器学习在实际应用场景当中应用时遇到的一些问题以及解决问题的一些tricks。而在实际应用中,经验和tricks往往比如何实现...

12月总结

12月总结 2016年的最后一个月,过得没我想象中的那么慢。邻近期末,有各种各样的Presentation、论文以及期末考试要准备,当然,大部分时间还是放在了实习上。所以说虽然事情比较多,也比较忙,但是个人感觉没有提升太多,效率相比之前自己看书或者排期做计划要差上许多。 当然,也不是说实...