文章詳情頁

python 使用pandas同時對多列進行賦值

瀏覽：5日期：2022-06-25 09:43:30

如dataframe

data1[’月份’]=int(month) #加入月份和企業名稱 data1[’企業’]=parmentname

可以增加單列，并賦值，如果想同時對多列進行賦值

data1[’月份’,’企業’]=int(month) , parmentname #加入月份和企業名稱

會出錯

ValueError: Length of values does not match length of index

data[[’合計’,’平均’]]=’數據’,’月份’

類似這樣的，也無效

KeyError: “None of [Index([‘合計’, ‘平均’], dtype=‘object’)] are in the [columns]”

只有下例中：

import pandas as pdchengji=[[100,95,100,99],[90,98,99,100],[88,95,98,88],[99,98,97,87],[96.5,90,96,85],[94,94,93,91],[91, 99, 92, 87], [85, 88, 85, 90], [90, 92, 99, 88], [90, 88, 89, 81], [85, 89, 89, 82], [95, 87, 86, 88], [90, 97, 97, 98], [80, 92, 89, 98], [80, 98, 85, 81], [98, 88, 95, 92]]data=pd.DataFrame(chengji,columns=[’語文’,’英語’,’數學’,’政治’])print (data)# data1=data[[’數學’,’語文’,’英語’,’政治’]] #排序# data1=data1.reset_index(drop=True) #序列重建# data1.index.names=[’序號’] #序列重命名# data1.index=data1.index+1 #序列從1開始# print (data1)data=pd.DataFrame(chengji,columns=[’語文’,’英語’,’數學’,’政治’],index=[i for i in range(1,len(chengji)+1)])print (data)data[[’合計’,’平均’]]=data.apply(lambda x: (x.sum(), x.sum()/4),axis=1,result_type=’expand’)print (data[:])data=pd.DataFrame(chengji,columns=[’語文’,’英語’,’數學’,’政治’],index=[i for i in range(1,len(chengji)+1)])print (data)data[[’合計’,’平均’]]=data.apply(lambda x:(’數據’,’月份’),axis=1,result_type=’expand’)print (data[:])

應用apply 并設置result_type=‘expand’ 參數才可以。

先前的例子，用如下的方法就行了

data1[[’月份’,’企業’]]=data1.apply(lambda x:(int(month),parmentname),axis=1,result_type=’expand’) # data1[’月份’]=int(month) #加入月份和企業名稱 # data1[’企業’]=parmentname #print (data1)后記：

如果’月份’,’企業’列存在，用如下也可,上例中，直接可以創建不存在的列。

data1.lco[:,[’月份’,’企業’]]=int(month),parmentname

或

data1[[’月份’,’企業’]]=int(month),parmentname

今天又遇到一個從某列截取字符串長度寫到另一列的，也一并寫到這里：

貨品列在原表中無，取貨品代碼的前12位。

totaldata = totaldata.reset_index(drop=False)totaldata[’貨品’] = totaldata[’貨品代碼’].apply(lambda x:x[:12])后記：2020.5.17又遇到想新增兩列并賦值的問題

import numpy as npimport pandas as pdfrom pandas import Series chengji = [[’N’, 95, 0], [’N’, 100, 88], [’N’, 88, 100], [’N’, 66, 0]]data = pd.DataFrame(chengji, columns=[’p’, ’x’, ’g’])data[[’序號’,’列名’]]=data[[’p’,’x’]] #pd.DataFrame(data[[’p’,’x’]])# .apply(lambda x : x )print(data)

補充：pandas 的apply返回多列，并賦值

代碼如下：

import pandas as pddf_tmp = pd.DataFrame([ {'a':'data1', 'cnt':100},{'a':'data2', 'cnt':200},])df_tmpa cntdata1 100data2 200方法一：使用apply 的參數result_type 來處理

def formatrow(row): a = row['a'] + str(row['cnt']) b = str(row['cnt']) + row['a'] return a, b df_tmp[['fomat1', 'format2']] = df_tmp.apply(formatrow, axis=1, result_type='expand')df_tmpa cnt fomat1 format2data1 100 data1100 100data1data2 200 data2200 200data2方法二：使用zip打包返回結果來處理

df_tmp['fomat1-1'], df_tmp['format2-2'] = zip(*df_tmp.apply(formatrow, axis=1))df_tmpa cnt fomat1 format2 fomat1-1 format2-2data1 100 data1100 100data1 data1100 100data1data2 200 data2200 200data2 data2200 200data2

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方，望不吝賜教。

Python 編程

上一條：Python openpyxl 無法保存文件的解決方案下一條：使用python處理一萬份word表格簡歷操作

相關文章：

1. Java GZip 基于內存實現壓縮和解壓的方法2. idea配置jdk的操作方法3. SpringBoot+TestNG單元測試的實現4. IntelliJ IDEA設置默認瀏覽器的方法5. python 浮點數四舍五入需要注意的地方6. Springboot 全局日期格式化處理的實現7. VMware中如何安裝Ubuntu8. Docker容器如何更新打包并上傳到阿里云9. 完美解決vue 中多個echarts圖表自適應的問題10. JAMon(Java Application Monitor)備忘記

排行榜

					
					Docker容器如何更新打包并上傳到阿里云
IntelliJ IDEA設置默認瀏覽器的方法
VMware中如何安裝Ubuntu
idea配置jdk的操作方法
JAMon(Java Application Monitor)備忘記
Java GZip 基于內存實現壓縮和解壓的方法
python 浮點數四舍五入需要注意的地方
完美解決vue 中多個echarts圖表自適應的問題
Springboot 全局日期格式化處理的實現
SpringBoot+TestNG單元測試的實現
golang:json 反序列化的[]和nil操作