由于我将熊猫从0.11版本更新到0.12,因此read_clipboard似乎不再起作用:
import pandas as pd
df = pd.read_clipboard()
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-2-6dead334eb54> in <module>()
----> 1 df = pd.read_clipboard()
C:\Python33\lib\site-packages\pandas\io\clipboard.py in read_clipboard(**kwargs)
16 from pandas.io.parsers import read_table
17 text = clipboard_get()
---> 18 return read_table(StringIO(text), **kwargs)
19
20
TypeError: initial_value must be str or None, not bytes
我所做的是:
在Excel 2010中打开一个CSV文件
复制一系列单元格,包括标题
如上述代码块所述,在iPython Qt控制台中执行read_clipboard
降级到0.11后,此过程再次正常运行。我正在为python 3.3 Win7 32位使用熊猫。
这是熊猫中的虫子吗?有关如何解决此问题的任何建议?
呈现给py3的字符串中的错误;我将在master中修复它,但是您可以进行本地编辑。
在 C:\python33\Lib\site-packages\pandas\io\clipboard.py
后 text = clipboard_get()
加 text = text.decode('UTF-8')
显然,剪贴板例程在py3中为您提供了字节(而不是字符串)
首先,我对Python完全是新手,所以,也许是一些非常简单的事情我做得不对。 我正在读取一个多工作表xlsx文件,并将每个文件发送到单独的数据帧。(至少,我认为我正在这么做)。 这就是结果。 然后,我尝试打印每个df的一些列(手动尝试) 但我得到的只是: 正在显示任何值 如果我只调用,我会得到以下结果: 我做错了什么? 随着时间的推移,这是一项重大工作的一部分。我要做的就是过滤所有工作表的一些列,
我经常在终端上处理系列和数据流。序列的默认返回一个简化的示例,包含一些头值和尾值,但缺少其余值。 有没有一种内置的方法来漂亮地打印整个系列/数据帧?理想情况下,它将支持正确的对齐方式,可能支持列之间的边框,甚至支持不同列的颜色编码。
如果是这样,那怎么可能是封装呢?变量仍然是公共的。将其声明为private将迫使我创建一个setter和getter来获取变量,因为private可见性修饰符。 我将其与Java进行比较,后者通常将成员变量作为private以及每个成员变量的public setter和getter。
问题内容: Python 3.4和Pandas 0.15.0 df是一个数据框,而col1是一列。使用下面的代码,我正在检查是否存在值10,并将此类值替换为1000。 这是另一个例子。这次,我将基于索引更改col2中的值。 这两种都会产生以下警告: 最后, 这会产生类似的警告,并带有以下建议: 我不确定我是否理解警告中指出的讨论。编写这三行代码的更好方法是什么? 请注意,该操作有效。 问题答案:
问题内容: 我想将 大于任意数(在这种情况下为100)的值替换为(因为如此大的值表示实验失败)。以前,我使用它来替换不需要的值: 但是,出现以下错误: 从这个StackExchange问题来看,有时似乎可以忽略此警告,但是我不能很好地跟踪讨论,无法确定这是否适用于我的情况。警告基本上是让我知道我将覆盖我的某些值吗? 编辑:据我所知,一切都按其应有的方式进行。作为后续措施,我的替换值方法是否非标
我有一个数据帧,如: 所以我想通过两个“for循环”添加一些列,如: 新的类似数据帧的图片: 我的代码不起作用: 如何编写代码来获得像第二张图片这样的数据帧?
问题内容: 我刚刚发现了json_normalize函数,该函数在获取JSON对象并给我一个熊猫Dataframe时效果很好。现在,我想要反向操作,该操作采用相同的Dataframe并给我一个与原始json具有相同结构的json(或类似json的字典,我可以轻松地将其转换为json)。 这是一个示例:https : //hackersandslackers.com/json-into-pandas
问题内容: 在下面,male_trips是一个大熊猫数据帧,station是一个小熊猫数据帧。对于每个车站ID,我想知道有多少次男性旅行。以下工作可以完成,但是需要很长时间: 我应该怎么做呢? 更新!因此,有两种主要方法:其次是和更简单的方法。我很快完成了,这种方法大获全胜!这是代码: 结果如下: 请注意,以这种速度,用于探索数据 键入 value_counts的速度稍微快一些,而且记不起来了!