课程进度 88% · 第13/14章第13/14章 · 标签 1/4
— 1 —
基础知识面试题
1. 什么是词向量?常见的词向量模型有哪些?
词向量是将词语映射到低维稠密向量空间的技术,能够捕捉词语之间的语义关系。
常见的词向量模型包括:
- Word2Vec:包括CBOW和Skip-gram两种模型
- GloVe:基于全局词频统计的词向量模型
- FastText:考虑词内部结构的词向量模型
- ELMo:基于上下文的动态词向量模型
- BERT:预训练语言模型生成的上下文相关词向量
— 2 —
2. 什么是TF-IDF?它的优缺点是什么?
TF-IDF(词频-逆文档频率)是一种用于评估词语重要性的统计方法。
优点:
- 计算简单,易于实现
- 考虑了词频和文档频率
- 能够突出重要词语
缺点:
- 没有考虑词语的位置信息
- 没有考虑词语的语义信息
- 无法处理同义词和多义词