久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

python 數據分析實現長寬格式的轉換

瀏覽:54日期:2022-07-25 09:59:15

我就廢話不多說了,大家還是直接看代碼吧!

# encoding=utf-8import numpy as npimport pandas as pd# 長寬格式的轉換# 1data = pd.read_csv(’d:data/macrodata.csv’)print ’data:=n’, dataprint ’data.to_records():=n’, data.to_records()print ’data.year:=n’, data.yearprint ’data.quarter:=n’, data.quarterperiods = pd.PeriodIndex(year=data.year, quarter=data.quarter, name=’date’)print ’periods:=n’, periodsdata = pd.DataFrame(data.to_records(), columns=pd.Index([’realgdp’, ’infl’, ’unemp’], name=’item’), index=periods.to_timestamp(’D’, ’end’))print ’data:=n’, dataldata = data.stack().reset_index().rename(columns={0: ’value’})# print ’ldata:=n’, ldataprint ’ldata.get(’realgdp’):=n’, ldata.get(’realgdp’)print ’ldata.get(’unemp’):=n’, ldata.get(’unemp’)wdata = ldata.pivot(’date’, ’item’, ’value’)print ’ldata:=n’, ldataprint ’wdata:=n’, wdata# 2print ’ldata[:10]:=n’, ldata[:10]pivoted = ldata.pivot(’date’, ’item’, ’value’)print ’pivoted:=n’, pivotedprint ’pivoted.head():=n’, pivoted.head()print ’ldata:=n’, ldataldata[’value2’] = np.random.randn(len(ldata))print ’ldata[’value2’]:=n’, ldata[’value2’]print ’ldata[:10]:=n’, ldata[:10]pivoted = ldata.pivot(’date’, ’item’)print ’pivoted:=n’, pivotedprint pivoted[:5]print ’pivoted[’value’][:5]:=n’, pivoted[’value’][:5]print ’ldata:=n’, ldataunstacked = ldata.set_index([’date’, ’item’]).unstack(’item’)print ’unstacked:=n’, unstackedprint ’test’

補充知識:python使用_pandas_用stack和unstack進行行列重塑(key-value變寬表)

數據結構的重塑(reshape)

與數據庫交互時常遇到堆疊格式(key-value)和寬表形式(dataframe)的轉換,如:

堆疊格式:

python 數據分析實現長寬格式的轉換

寬表形式dataframe:

python 數據分析實現長寬格式的轉換

下面是相互轉換的示例代碼:

import pandas as pdimport numpy as np # 常用的表格形式的數據結構df = pd.DataFrame(np.arange(6).reshape((2,3)), index=[’id1’,’id2’], columns=[’attr1’,’attr2’,’attr3’])print(df)out: attr1 attr2 attr3id1 0 1 2id2 3 4 5 # 寬表形式(dataframe)轉變為堆疊形式(key-value)形式# 數據庫中常以該形式存儲df_key_value = df.stack().reset_index()df_key_value.columns = [’id’, ’attr’, ’value’]print(df_key_value)out:idattrvalue0id1attr101id1attr212id1attr323id2attr134id2attr245id2attr35 # 堆疊轉換為寬表形式 # 用set_index創建層次化索引,在用unstack重塑# unstack中作為旋轉軸的變量(如attr),其值會作為列變量展開df_key_value.set_index([’id’,’attr’]).unstack(’attr’)out:valueattrattr1attr2attr3idid1012id2345 # 多層索引轉化為寬表df_long = df_key_value.set_index([’id’,’attr’]).unstack(’attr’)[’value’].reset_index()df_longout:attridattr1attr2attr30id10121id2345 # 堆疊轉換為寬表的快捷鍵---pivotdf_key_value.pivot(’id’,’attr’,’value’)out:attrattr1attr2attr3idid1012id2345

以上這篇python 數據分析實現長寬格式的轉換就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 仁寿县| 平原县| 昭通市| 安新县| 新津县| 天等县| 龙里县| 定远县| 延寿县| 巴彦县| 皋兰县| 南投市| 洪湖市| 二连浩特市| 信阳市| 南投县| 油尖旺区| 湘潭市| 巴南区| 胶州市| 洪雅县| 内乡县| 康马县| 红安县| 北川| 团风县| 临泽县| 左权县| 黄冈市| 荔浦县| 离岛区| 成都市| 宾川县| 湟源县| 阿克| 舟山市| 安龙县| 揭东县| 当雄县| 宝山区| 丽水市|