当前位置: 首页 > 面试题库 >

NLTK。查找句子是否为疑问形式

秋阳旭
2023-03-14
问题内容

我试图检测一个句子是一个问题还是一个陈述。除了在句子结尾处查找问号外,还有其他方法可以检测到此问题吗?我正在处理Twitter帖子,人们不一定遵循Twitter上的问号之类的良好做法。

如果nltk现在可以正常工作,则对其他库的引用也可以。


问题答案:

一种简单的方法是解析一个句子并寻找分配给它的标签。例如,解析句子“有没有办法做到这一点?” 使用斯坦福解析器将返回:

(ROOT
  (SQ (VBZ Is)
    (NP (EX there))
    (NP
      (NP (DT any) (JJ other) (NN way))
      (S
        (VP (TO to)
          (VP (VB do)
            (NP (DT this))))))
    (. ?)))

其中SQ表示“在SBARQ中的whi短语之后,是“是/否”问题或wh问题的主要子句”。另一个例子:

(ROOT
  (SBARQ
    (WHNP (WP What))
    (SQ (VBZ is)
      (NP
        (NP (DT the) (NN capital))
        (PP (IN of)
          (NP (NNP Scotland)))))
    (. ?)))

其中SBARQ表示“直接由疑问词或短语引起的问题”。从Python调用外部解析器并处理其输出非常简单,例如,检查此Python与Stanford NLP工具的接口。



 类似资料:
  • 我试着检测一个句子是问句还是陈述。除了在句末找一个问号,有没有另外一种方法可以检测到这一点呢?我正在处理Twitter的帖子,人们并不一定遵循良好的做法,比如Twitter上的问号。 如果nltk现在起作用,对其他库的引用也是可以的。

  • 问题内容: 是否有任何原因为什么或为什么不应该在子查询中执行“排序依据”? 问题答案: 是:不应这样做,因为从概念上讲这没有意义。 子查询将在某些外部查询中使用(否则它将毫无意义),并且该外部查询无论如何都必须进行排序,因此对子查询进行排序没有任何意义。 这是因为除非使用显式ORDER,否则SQL中的查询结果将没有特定的顺序。因此,即使您在子查询中使用了ORDER,也无法保证这会影响外部查询的结果

  • 我一直在环顾该网站,但找不到问题的答案。我需要能够浏览给定数量的字符串并计算单词中的元音数量。如果元音的数量与之前输入的数字匹配,则打印 YES。我尝试使用字符串数组,然后遍历数组中的每个单词以查找元音,为找到的每个元音增加元音检查(vocheck),然后检查vocheck是否等于适当的数字。但是,当我检查 vocheck for 循环是否有效时,它只是将 vocheck 保持为 0。怎么了? 这

  • 我试图找出两个矩形是否相互重叠。我将下面的矩形表示为< code>[x1,x2] x [y1,y2] 我只需要一个伪代码,我可以实现它来查找矩形是否彼此重叠。

  • 问题内容: 我正在使用NLTK来分析一些经典文本,并且遇到麻烦按句子标记文本的麻烦。例如,这是我从 Moby Dick 获得的摘录的内容: 考虑到梅尔维尔(Melville)的语法有些陈旧,我不希望在这里达到完美,但是NLTK应该能够处理终端双引号和标题,例如“ Mrs”。但是,由于令牌生成器是无监督训练算法的结果,所以我不知道该如何进行修补。 有人建议使用更好的句子标记器吗?我更喜欢可以破解的简

  • 问题内容: 我是Node.js和Heroku的新手,我构建了一个使用node.js并从mongodb实例检索一些数据的小应用程序。我设置了整个程序,但是我的问题是我认为mongodb的语法很简单。 我需要在启动应用程序时知道我的收藏夹中是否包含任何东西,如果没有,则不进行初始化。我尝试调用collection.count(),但返回未定义。 我尝试这样做 任何帮助表示赞赏。 问题答案: 任何访问数

  • 问题内容: 对于我因此遇到的所有Dockerfile(虽然数量不多),它们所有人都使用了子句作为现有映像的基础,即使它是。 这个条款是必需的吗?有没有子句的Dockerfile是否可能?这样创建的容器可以执行任何操作吗? 编辑 我读 没有FROM指令的Dockerfile没有父映像,称为基本映像。 https://docs.docker.com/glossary/?term=parent%20im

  • 问题内容: 有在TF-IDF的实现和。 有简单的实现Python中的N-Gram,tf- idf和余弦相似性的简单实现 为了避免重新发明轮子, NLTK中真的没有TF-IDF吗? 是否有可用于在NLTK中实现TF-IDF的子包? 如果有怎么办? 在该博客文章中,NLTK没有它。 真的吗? http://www.bogotobogo.com/python/NLTK/tf_idf_with_sciki