python操作xlsx文件

在網(wǎng)上瀏覽了一下,比較了一下,python使用openpyxl庫處理xlsx文件是比較好的選擇。

目錄:

安裝

pip install openpyxl

基本使用

Simple Usage

基本的使用主要涉及以下三個模塊:

openpyxl主要模塊

讀取文件

導(dǎo)入load_workbook方法

from openpyxl import load_workbook

導(dǎo)入文件獲取workbook

wb = load_workbook('file_name')

參數(shù)特別說明:

  • read_only:只讀模式,無法編輯內(nèi)容,可以優(yōu)化數(shù)據(jù)讀取速度(自測,能夠提高50%),默認為False
  • data_only:控制單元格是讀取公式還是文件讀取時的值,默認為False(只獲取計算結(jié)果,并不關(guān)心具體公式,可以設(shè)置為True)

注:read_only設(shè)置為True,則無法按列訪問單元格。而且必須調(diào)用close()顯示關(guān)閉workbook

獲取worksheet

  1. 根據(jù)sheet名稱獲取

    ws = wb['sheet_name']
    
  2. 遍歷sheet獲取

    for sheet in wb:
        ... ...
    
  3. 操作完成后注意關(guān)閉workbook: wb.close()

操作數(shù)據(jù)

獲取worksheet后,獲取其中的數(shù)據(jù):

批量獲取

  1. 獲取指定行

    sheet[1]
    

    輸入所需行號:1, 2 ,3, ...

  2. 獲取指定列

    sheet['A']
    

    輸入所需列標:'A', 'B', 'C', ...

  3. 獲取指定單元格

    sheet['A1']
    
  4. 獲取指定范圍的單元格

    sheet['A2:D2']  # 獲取行
    sheet['A2:A4']  # 獲取列
    sheet['A1:D4']  # 獲取4行4列
    

    通過這樣的方式得到的元素是二維元組,通過迭代訪問單元格:

    for row in sheet['A1:D4']:
        for cell in row:
            print(cell.value)
    

操作cell

  1. 獲取值: cell.value

    注意:空單元格值為None

  2. 獲取cell所在行: cell.row

  3. 獲取cell所在列:cell.column

添加數(shù)據(jù)

添加行

末尾增加一行

ws.append(['cell1', 'cell 2'])

指定位置插入一行

ws.insert_rows(7)
for cell in ws[7]:
    cell.value = 'cell value'

添加列

指定位置插入列

ws.insert_cols(2)
for i in ws.max_row:
    cell = ws.cell(i, 2)
    cell.value = 'cell value'

Insert column using openpyxl

刪除數(shù)據(jù)

刪除指定行

ws.delete_rows(2)

刪除指定列

ws.delete_cols(2)

寫入到文件

類似使用的例子:Using filters and sorts

data = [
    ["Fruit", "Quantity"],
    ["Kiwi", 3],
    ["Grape", 15],
    ["Apple", 3]
]

wb = Workbook()
ws = wb.active
for r in date:
    ws.append(r)
wb.save('file_name')
  • 寫入文件的數(shù)據(jù)是二維數(shù)組;
  • 使用worksheet.append(),填加一行內(nèi)容,內(nèi)容是一個數(shù)組;
  • save()方法會以'w'的模式去寫入文件,注意覆蓋的問題。

為單元格添加樣式

樣式相關(guān)的模塊都在openpyxl.styles package

該例只添加單元格的底色:

導(dǎo)入PatternFill

from openpyxl.styles import PatternFill

創(chuàng)建填充實例

style = PatternFill("solid", fgColor="E2EFDA")

填充單元格

cell.fill = style

保存更改

wb.save(path)

例子

有時候期望填充一行而不是單個單元格,則可以進行如下操作:

from openpyxl import Workbook, load_workbook
from openpyxl.styles import PatternFill

path = './test.xlsx'
wb = load_workbook(filename=path)
ws = wb['Sheet1']
style = PatternFill("solid", fgColor="E2EFDA")
for cell in ws[1]:
    cell.fill = style
wb.save(path)
wb.close() // maybe Unnecessary

從xlsx中導(dǎo)入數(shù)據(jù)

from openpyxl import load_workbook

def import_data(file_path: str, sheets=[]):
    wb = load_workbook(file_path)
    if not sheets:
        sheets = wb.sheetnames
    for sheet in sheets:
        print(f'--- begin execute [{sheet}]')
        ws = wb[sheet]
        rows = ws.values
        header = next(rows)
        print(f'|-- header: {header}')
        user = dict()
        for row in rows:
            for i, h in enumerate(header):
                if h == '姓名':
                    user['name'] = row[i]
                ......
        # save user or do further operations

常用方法

workbook module常用屬性

  1. sheetnames:獲取工作表名稱列表

worksheet module 常用屬性

  1. dimensions:返回包含數(shù)據(jù)的所有單元格的最小邊界范圍

    • TODO: 不清楚會不會自動忽略空值行
  2. max_column:包含數(shù)據(jù)的最大列數(shù)

  3. max_row:包含數(shù)據(jù)的最大行數(shù)

  4. values:按行獲取所有單元格的值,返回一個生成器

cell model 常用屬性

  1. row:單元格的行號(從1開始)

  2. column:單元格的列索引字母(從A開始)

  3. col_idx:單元格的列號(從1開始)

  4. column_letter:單元格的字母索引(A, B, ...)

  5. coordinate: 單元格的坐標(比如:A1)

  6. parent:單元格所在的worksheet

  7. data_type:單元格值的類型

    TYPE_STRING = 's'
    TYPE_FORMULA = 'f'
    TYPE_NUMERIC = 'n'
    TYPE_BOOL = 'b'
    TYPE_NULL = 'n'
    TYPE_INLINE = 'inlineStr'
    TYPE_ERROR = 'e'
    TYPE_FORMULA_CACHE_STRING = 'str'
    

來源于:mr_wolverine

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容