题目
在潜在语义分析中,给定M个单词和N个文档所构成的单词,文档矩阵(term-document)矩阵,对其进行分解,将单词或文档映射到一个R维的隐性空间。下面描述不正确的是()A. 隐性空间维度的大小由分解过程中所得对角矩阵中对角线上不为零的系数个数所决定B. 这一映射过程中需要利用文档的类别信息C. 通过矩阵分解可重建原始单词文档矩阵,所得到的重建矩阵结果比原始单词文档矩阵更好捕获了单词单词,单词文档,文档文档之间的隐性关系D. 单词和文档映射到隐性空间后具有相同的维度
在潜在语义分析中,给定M个单词和N个文档所构成的单词,文档矩阵(term-document)矩阵,对其进行分解,将单词或文档映射到一个R维的隐性空间。下面描述不正确的是()
A. 隐性空间维度的大小由分解过程中所得对角矩阵中对角线上不为零的系数个数所决定
B. 这一映射过程中需要利用文档的类别信息
C. 通过矩阵分解可重建原始单词文档矩阵,所得到的重建矩阵结果比原始单词文档矩阵更好捕获了单词单词,单词文档,文档文档之间的隐性关系
D. 单词和文档映射到隐性空间后具有相同的维度
题目解答
答案
B. 这一映射过程中需要利用文档的类别信息
解析
步骤 1:理解潜在语义分析(LSA)的基本概念
潜在语义分析(LSA)是一种用于分析文档和单词之间关系的技术。它通过将单词-文档矩阵分解为三个矩阵(U, S, V)来实现,其中S是一个对角矩阵,其对角线上的元素是奇异值,这些奇异值决定了隐性空间的维度。
步骤 2:分析选项A
选项A描述了隐性空间维度的大小由分解过程中所得对角矩阵中对角线上不为零的系数个数所决定。这是正确的,因为对角矩阵S中的非零奇异值个数决定了隐性空间的维度。
步骤 3:分析选项B
选项B描述了这一映射过程中需要利用文档的类别信息。这是不正确的,因为LSA是一种无监督学习方法,它不需要利用文档的类别信息来执行矩阵分解和映射。
步骤 4:分析选项C
选项C描述了通过矩阵分解可重建原始单词文档矩阵,所得到的重建矩阵结果比原始单词文档矩阵更好捕获了单词单词,单词文档,文档文档之间的隐性关系。这是正确的,因为LSA通过降维和重建矩阵,可以更好地捕捉到单词和文档之间的隐性关系。
步骤 5:分析选项D
选项D描述了单词和文档映射到隐性空间后具有相同的维度。这是正确的,因为LSA将单词和文档都映射到同一个隐性空间中,它们在这个空间中具有相同的维度。
潜在语义分析(LSA)是一种用于分析文档和单词之间关系的技术。它通过将单词-文档矩阵分解为三个矩阵(U, S, V)来实现,其中S是一个对角矩阵,其对角线上的元素是奇异值,这些奇异值决定了隐性空间的维度。
步骤 2:分析选项A
选项A描述了隐性空间维度的大小由分解过程中所得对角矩阵中对角线上不为零的系数个数所决定。这是正确的,因为对角矩阵S中的非零奇异值个数决定了隐性空间的维度。
步骤 3:分析选项B
选项B描述了这一映射过程中需要利用文档的类别信息。这是不正确的,因为LSA是一种无监督学习方法,它不需要利用文档的类别信息来执行矩阵分解和映射。
步骤 4:分析选项C
选项C描述了通过矩阵分解可重建原始单词文档矩阵,所得到的重建矩阵结果比原始单词文档矩阵更好捕获了单词单词,单词文档,文档文档之间的隐性关系。这是正确的,因为LSA通过降维和重建矩阵,可以更好地捕捉到单词和文档之间的隐性关系。
步骤 5:分析选项D
选项D描述了单词和文档映射到隐性空间后具有相同的维度。这是正确的,因为LSA将单词和文档都映射到同一个隐性空间中,它们在这个空间中具有相同的维度。