av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python - 關(guān)于NumPy數(shù)組操作的問(wèn)題

瀏覽:136日期:2022-06-26 18:57:18

問(wèn)題描述

[’000001_2017-03-17.csv’, ’000001_2017-03-20.csv’, ’000002_2017-03-21.csv’, ’000002_2017-03-22.csv’, ’000003_2017-03-23.csv’, ’000004_2017-03-24.csv’]

numpy數(shù)組,總共有幾個(gè)萬(wàn)個(gè)元素。現(xiàn)在想保留每個(gè)元素前面的編號(hào)000001之類的,并且去掉重復(fù),只保留唯一的一個(gè)編號(hào)。結(jié)果應(yīng)該是[’000001’,’000002’,’000003’,’000004’]除了用for語(yǔ)句實(shí)現(xiàn)外,有沒(méi)有更高效的辦法?

問(wèn)題解答

回答1:

寫個(gè)NumPy的吧~

python3

>>> import numpy as np>>> a = np.array([’000001_2017-03-17.csv’, ’000001_2017-03-20.csv’, ’000002_2017-03-21.csv’, ’000002_2017-03-22.csv’, ’000003_2017-03-23.csv’, ’000004_2017-03-24.csv’])>>> b = np.unique(np.fromiter(map(lambda x:x.split(’_’)[0],a),’|S6’))>>> barray([b’000001’, b’000002’, b’000003’, b’000004’], dtype=’|S6’)

還可以這樣寫:np.frompyfunc’|S6’是以6個(gè)字節(jié)存儲(chǔ)字符串

’<U6’是以6個(gè)小端序Unicode字符存儲(chǔ)字符串

>>> b = np.array(np.unique(np.frompyfunc(lambda x:x[:6],1,1)(a)),dtype=’<U6’)>>> barray([’000001’, ’000002’, ’000003’, ’000004’], dtype=’<U6’)回答2:

綜合兩位仁兄的寫法@同意并接受 @xiaojieluoff

如果編號(hào)長(zhǎng)度固定是前六位,最快的寫法下面第一種最快

import timelst = [’000001_2017-03-17.csv’, ’000001_2017-03-20.csv’, ’000002_2017-03-21.csv’, ’000002_2017-03-22.csv’, ’000003_2017-03-23.csv’, ’000004_2017-03-24.csv’] * 1000000start = time.time()data = {_[:6] for _ in lst}print ’dic: {}’.format(time.time() - start)start = time.time()data = set(_[:6] for _ in lst)print ’set: {}’.format(time.time() - start)start = time.time()data = set(map(lambda _: _[:6], lst))print(’map:{}’.format(time.time() - start))start = time.time()data = set()[data.add(_[:6]) for _ in lst]print(’for:{}’.format(time.time() - start))耗時(shí):dic: 0.72798705101set: 0.929664850235map:1.89214396477for:1.76194214821回答3:

使用 map 和匿名函數(shù)

lists = [’000001_2017-03-17.csv’, ’000001_2017-03-20.csv’,’000002_2017-03-21.csv’,’000002_2017-03-22.csv’,’000003_2017-03-23.csv’, ’000004_2017-03-24.csv’]data = list(set(map(lambda x:x.split(’_’)[0], lists)))print(data)

輸出:

[’000003’, ’000004’, ’000001’, ’000002’]

運(yùn)行下面代碼可以看到 , 在 6百萬(wàn) 條數(shù)據(jù)下,map 比 for 快了 0.6s 左右

import timelists = [’000001_2017-03-17.csv’, ’000001_2017-03-20.csv’, ’000002_2017-03-21.csv’, ’000002_2017-03-22.csv’, ’000003_2017-03-23.csv’, ’000004_2017-03-24.csv’] * 1000000map_start = time.clock()map_data = list(set(map(lambda x:x.split(’_’)[0], lists)))map_end = (time.clock() - map_start)print(’map 運(yùn)行時(shí)間:{}’.format(map_end))for_start = time.clock()data = set()for k in lists: data.add(k.split(’_’)[0])for_end = (time.clock() - for_start)print(’for 運(yùn)行時(shí)間:{}’.format(for_end))

輸出:

map 運(yùn)行時(shí)間:2.36173for 運(yùn)行時(shí)間:2.9405870000000003

如果把測(cè)試數(shù)據(jù)擴(kuò)大到 6千萬(wàn), 差距就更明顯了

map 運(yùn)行時(shí)間:29.620203for 運(yùn)行時(shí)間:33.132621

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 国产精品国产三级国产aⅴ中文 | 国产一区在线免费 | www.4hu影院 | 国产乱码精品1区2区3区 | 天天色天天色 | av电影一区二区 | 亚洲精品一区二区三区 | 成人激情视频在线播放 | 久久天天躁狠狠躁夜夜躁2014 | 国产高清视频 | av一级在线观看 | 亚洲精品一区二区三区蜜桃久 | 四虎在线视频 | 午夜精品久久久久久久星辰影院 | 久夜精品 | 在线视频 欧美日韩 | 91视频网址 | 久久久不卡网国产精品一区 | 国产欧美一区二区久久性色99 | 一区二区三区免费 | 日韩精品成人一区二区三区视频 | 欧美日韩精品 | 男人的天堂在线视频 | 美国一级片在线观看 | 免费的色网站 | 日韩视频三区 | 精品国产1区2区3区 在线国产视频 | 一区二区三区在线免费观看 | 综合二区| 欧美日韩国产一区二区 | 免费看国产一级特黄aaaa大片 | 欧美美女爱爱 | 91麻豆精品国产91久久久久久 | 国产精品视频网站 | 狠狠狠 | 超碰97免费 | 久久一 | 免费特黄视频 | 91日日| 特黄色毛片 | 国产精品美女久久久久久久网站 |