由于某种原因,我无法获得此简单的声明来处理ñ。它似乎可以在其他任何东西上工作,但不喜欢那个角色。有任何想法吗?
DF['NAME']=DF['NAME'].str.replace("ñ","n")
谢谢
我假设您在这里使用Python 2.x,这可能是Unicode问题。不用担心,您并不孤单-unicode通常非常困难,尤其是在Python 2中,这就是为什么它在Python 3中成为标准的原因。
如果您只关心ñ,则应使用UTF-8解码,然后仅替换一个字符。
看起来类似于以下内容:
DF['name'] = DF['name'].str.decode('utf-8').replace(u'\xf1', 'n')
举个例子:
>>> "sureño".decode("utf-8").replace(u"\xf1", "n")
u'sureno'
如果您的字符串已经是Unicode,则可以(实际上必须)跳过该decode步骤:
>>> u"sureño".replace(u"\xf1", "n")
u'sureno'
请注意,此处u’\xf1’将十六进制转义用于所讨论的字符。
更新资料
我在评论中被告知<>.str.replace是熊猫系列方法,但我没有意识到。对此的答案可能类似于以下内容:
DF['name'] = map(lambda x: x.decode('utf-8').replace(u'\xf1', 'n'), DF['name'].str)
或类似的东西(如果该熊猫对象是可迭代的)。
另一个更新
实际上,我刚想到您的问题可能很简单,如下所示:
DF['NAME']=DF['NAME'].str.replace(u"ñ","n")
请注意,我是如何u在字符串前面添加使其成为unicode的。
有没有办法用gsub替换R中的特殊字符串?我有几列里面有,我想把它改为,但是gsub不起作用 下面是一个例子: 我收到以下输出:
问题内容: 我该如何更换: “ã”和“ a” “é”和“ e” 在PHP中?这可能吗?我读过某处我可以使用基本字符的ascii值和重音符号的ascii值进行一些数学运算,但是现在找不到任何参考。 问题答案: 这个答案是不正确的。 编写它时,我不理解Unicode规范化。查看francadaval的评论和链接 签出Normalizer类来执行此操作。文档很好,所以我将其链接起来,而不是在这里重复:
问题内容: 我想删除的特殊字符,如多次出现,,,从我的java字符串由单下划线。我试过了 并且似乎用下划线替换了连续的相同类型的特殊字符,但否则不起作用。例如: 变成 (下划线有2个。)但是应该是。 同样对于失败的情况。我也尝试使用regex并做了一个正则表达式 但这仍然无济于事。我该如何实现? 问题答案: 注意,这是对与第一个捕获组匹配的 内容 的反向引用。要实际匹配字符类中的一个或多个任何字符
问题内容: 是否有任何库可以将特殊字符替换为ASCII等效项,例如: 至: 我当然可以创建地图: 并使用一些替换功能。但是我不想将所有等效项硬编码到我的程序中,如果已经有一些功能可以做到这一点。 问题答案:
问题内容: 我正在使用urllib从网站获取html字符串,并且需要将html文档中的每个单词放入列表中。 这是我到目前为止的代码。我不断收到错误消息。我还复制了以下错误。 这是错误。 问题答案: str.replace是您要执行的操作错误的函数(除了使用不正确之外)。您想用空格代替集合的任何字符,而不是用单个空格代替整个集合(后者是replace的作用)。您可以使用以下翻译: 这将创建一个映射,
如何用单个字符替换n/重复字符?所有特殊字符
问题内容: 我有php文档signup.php,它将内容从form(在form.php文档中)保存到MySQL基础。当我要重新格式化输入内容时会出现问题。我想对à-> a这样的UTF-8字符进行解码。 为什么它对$ chain完美起作用,但对于$ first_name或$ last_name不起作用? 我也尝试 但是正如您所看到的,问题是相同的! 问题答案: 有一种更简单的方法,使用-从用户说明中
我有一个包含以下列的表: 然后,我手动将更新sql编写为 现在,这个解决方案对我来说并不现实。我查看了以下与Regex相关的链接和它周围的其他链接。 更新和替换字符串的一部分 https://www.codeproject.com/questions/456246/replace-special-characters-in-sql 我如何编写能够处理所有这些特殊字符的更新sql?