当前位置: 首页 > 编程笔记 >

Python 中pandas.read_excel详细介绍

汝昀
2023-03-14
本文向大家介绍Python 中pandas.read_excel详细介绍,包括了Python 中pandas.read_excel详细介绍的使用技巧和注意事项,需要的朋友参考一下

Python 中pandas.read_excel详细介绍

#coding:utf-8
import pandas as pd
import numpy as np

filefullpath = r"/home/geeklee/temp/all_gov_file/pol_gov_mon/downloads/1.xls"
#filefullpath = r"/home/geeklee/temp/all_gov_file/pol_gov_mon/downloads/26368f3a-ea03-46b9-8033-73615ed07816.xls"
df = pd.read_excel(filefullpath,skiprows=[0])
#df = pd.read_excel(filefullpath, sheetname=[0,2],skiprows=[0])
#sheetname指定为读取几个sheet,sheet数目从0开始
#如果sheetname=[0,2],那代表读取第0页和第2页的sheet
#skiprows=[0]代表读取跳过的行数第0行,不写代表不跳过标题
#df = pd.read_excel(filefullpath, sheetname=None ,skiprows=[0])

print df
print type(df)
#若果有多页,type(df)就为<type 'dict'>
#如果就一页,type(df)就为<class 'pandas.core.frame.DataFrame'>
#{0:dataframe,1:dataframe,2:dataframe}

pandas.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0,
 index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None,
 na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None,
 engine=None, squeeze=False, **kwds)

Read an Excel table into a pandas DataFrame

参数解析:

io : string, path object (pathlib.Path or py._path.local.LocalPath),

  file-like object, pandas ExcelFile, or xlrd workbook. The string could be a URL. Valid URL schemes include http, ftp, s3, and file. For file URLs, a host is expected. For instance, a local file could be file://localhost/path/to/workbook.xlsx

sheetname : string, int, mixed list of strings/ints, or None, default 0

  Strings are used for sheet names, Integers are used in zero-indexed sheet positions.

  Lists of strings/integers are used to request multiple sheets.

  Specify None to get all sheets.

  str|int -> DataFrame is returned. list|None -> Dict of DataFrames is returned, with keys representing sheets.

  Available Cases

    Defaults to 0 -> 1st sheet as a DataFrame
    1 -> 2nd sheet as a DataFrame
    “Sheet1” -> 1st sheet as a DataFrame
    [0,1,”Sheet5”] -> 1st, 2nd & 5th sheet as a dictionary of DataFrames
    None -> All sheets as a dictionary of DataFrames

header : int, list of ints, default 0

  Row (0-indexed) to use for the column labels of the parsed DataFrame. If a list of integers is passed those row positions will be combined into a MultiIndex

skiprows : list-like

  Rows to skip at the beginning (0-indexed)

skip_footer : int, default 0

  Rows at the end to skip (0-indexed)

index_col : int, list of ints, default None

  Column (0-indexed) to use as the row labels of the DataFrame. Pass None if there is no such column. If a list is passed, those columns will be combined into a MultiIndex

names : array-like, default None

  List of column names to use. If file contains no header row, then you should explicitly pass header=None

converters : dict, default None

  Dict of functions for converting values in certain columns. Keys can either be integers or column labels, values are functions that take one input argument, the Excel cell content, and return the transformed content.

parse_cols : int or list, default None

    If None then parse all columns,
    If int then indicates last column to be parsed
    If list of ints then indicates list of column numbers to be parsed
    If string then indicates comma separated list of column names and column ranges (e.g. “A:E” or “A,C,E:F”)

squeeze : boolean, default False

  If the parsed data only contains one column then return a Series

na_values : list-like, default None

  List of additional strings to recognize as NA/NaN

thousands : str, default None

  Thousands separator for parsing string columns to numeric. Note that this parameter is only necessary for columns stored as TEXT in Excel, any numeric columns will automatically be parsed, regardless of display format.

keep_default_na : bool, default True

  If na_values are specified and keep_default_na is False the default NaN values are overridden, otherwise they're appended to

verbose : boolean, default False

  Indicate number of NA values placed in non-numeric columns

engine: string, default None

  If io is not a buffer or path, this must be set to identify io. Acceptable values are None or xlrd

convert_float : boolean, default True

  convert integral floats to int (i.e., 1.0 –> 1). If False, all numeric data will be read in as floats: Excel stores all numbers as floats internally

has_index_names : boolean, default None

  DEPRECATED: for version 0.17+ index names will be automatically inferred based on index_col. To read Excel output from 0.16.2 and prior that had saved index names, use True.

return返回的结果

parsed : DataFrame or Dict of DataFrames

  DataFrame from the passed in Excel file. See notes in sheetname argument for more information on when a Dict of Dataframes is returned.

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

 类似资料:
  • 本文向大家介绍详细介绍Python中的偏函数,包括了详细介绍Python中的偏函数的使用技巧和注意事项,需要的朋友参考一下 Python的functools模块提供了很多有用的功能,其中一个就是偏函数(Partial function)。要注意,这里的偏函数和数学意义上的偏函数不一样。 在介绍函数参数的时候,我们讲到,通过设定参数的默认值,可以降低函数调用的难度。而偏函数也可以做到这一点。举例如下

  • 本文向大家介绍Python中的tuple元组详细介绍,包括了Python中的tuple元组详细介绍的使用技巧和注意事项,需要的朋友参考一下 Tuple 是不可变 list。 一旦创建了一个 tuple 就不能以任何方式改变它。 Tuple 与 list 的相同之处 定义 tuple 与定义 list 的方式相同, 除了整个元素集是用小括号包围的而不是方括号。 Tuple 的元素与 list 一样按

  • 本文向大家介绍Python 模块EasyGui详细介绍,包括了Python 模块EasyGui详细介绍的使用技巧和注意事项,需要的朋友参考一下 Python 模块EasyGui详细介绍 前言: 在Windows想用Python开发一些简单的界面,所以找到了很容易上手的EasyGui库。下面就分享一下简单的使用吧。 参考的链接:官网Tutorial 接下来,我将从简单,到复杂一点点的演示如何使用这个

  • 本文向大家介绍Android中AsyncTask详细介绍,包括了Android中AsyncTask详细介绍的使用技巧和注意事项,需要的朋友参考一下 AsyncTask是一个很常用的API,尤其异步处理数据并将数据应用到视图的操作场合。其实AsyncTask并不是那么好,甚至有些糟糕。本文我会讲AsyncTask会引起哪些问题,如何修复这些问题,并且关于AsyncTask的一些替代方案。 Async

  • 本文向大家介绍maven中pom.xml详细介绍,包括了maven中pom.xml详细介绍的使用技巧和注意事项,需要的朋友参考一下 POM 代表工程对象模型。它是使用 Maven 工作时的基本组建,是一个 xml 文件。它被放在工程根目录下,文件命名为 pom.xml。 POM 包含了关于工程和各种配置细节的信息,Maven 使用这些信息构建工程。 POM 也包含了目标和插件。当执行一个任务或者目

  • 本文向大家介绍Python中的闭包详细介绍和实例,包括了Python中的闭包详细介绍和实例的使用技巧和注意事项,需要的朋友参考一下 一、闭包 来自wiki: 闭包(Closure)是词法闭包(Lexical Closure)的简称,是引用了自由变量的函数。这个被引用的自由变量将和这个函数一同存在,即使已经离开了创造它的环境也不例外。所以,有另一种说法认为闭包是由函数和与其相关的引用环境组合而成的实

  • 本文向大家介绍python中使用mysql数据库详细介绍,包括了python中使用mysql数据库详细介绍的使用技巧和注意事项,需要的朋友参考一下 一、安装mysql 如果是windows 用户,mysql 的安装非常简单,直接下载安装文件,双击安装文件一步一步进行操作即可。 Linux 下的安装可能会更加简单,除了下载安装包进行安装外,一般的linux 仓库中都会有mysql ,我们只需要通过一

  • 本文向大家介绍Python中的生成器和yield详细介绍,包括了Python中的生成器和yield详细介绍的使用技巧和注意事项,需要的朋友参考一下 列表推导与生成器表达式 当我们创建了一个列表的时候,就创建了一个可以迭代的对象: 这种创建列表的操作很常见,称为列表推导。但是像列表这样的迭代器,比如str、file等,虽然用起来很方便,但有一点,它们是储存在内存中的,如果值很大,会很麻烦。 而生成器