导航菜单

自然语言处理/NLP面试题
课程进度 88% · 第13/14章13/14章 · 标签 1/4
1

基础知识面试题

1. 什么是词向量?常见的词向量模型有哪些?

词向量是将词语映射到低维稠密向量空间的技术,能够捕捉词语之间的语义关系。

常见的词向量模型包括:

  • Word2Vec:包括CBOW和Skip-gram两种模型
  • GloVe:基于全局词频统计的词向量模型
  • FastText:考虑词内部结构的词向量模型
  • ELMo:基于上下文的动态词向量模型
  • BERT:预训练语言模型生成的上下文相关词向量
2

2. 什么是TF-IDF?它的优缺点是什么?

TF-IDF(词频-逆文档频率)是一种用于评估词语重要性的统计方法。

优点:

  • 计算简单,易于实现
  • 考虑了词频和文档频率
  • 能够突出重要词语

缺点:

  • 没有考虑词语的位置信息
  • 没有考虑词语的语义信息
  • 无法处理同义词和多义词