正則表達式 - python pandas的sep參數問題
問題描述
最近想學習利用python的pandas處理apache的大日志,從國外找了一篇文章鏈接描述,對方用的是sep正則表達式提取數據
pd.read_csv(file_name, sep=r’s(?=(?:[^']*'[^']*')*[^']*$)(?![^[]*])’, engine=’python’, na_values=’-’, header=None,usecols=[0, 3, 4, 5, 6, 7, 8], names=[’ip’, ’time’, ’request’, ’status’, ’size’, ’referer’, ’user_agent’], converters={’time’: parse_time, ’request’: parse_str, ’status’: int, ’size’: int, ’referer’: parse_str, ’user_agent’: parse_str})
apache的日志格式是
192.168.1.106 - - [23/Feb/2017:16:39:00 +0800] 'GET / HTTP/1.1' 200 2054 '-' 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.73 Safari/537.36'
得到的結果是其他參數容易理解,就是sep的正則表達式不大理解,而且好像和python的正則還有點區別,麻煩大神講解一下這個正則的含義
問題解答
回答1:sep參數是用于指定分割符,這個正則的意思是按空格分割,但是排除包括在[]或''中間的空格
相關文章:
1. docker - 如何修改運行中容器的配置2. javascript - Web微信聊天輸入框解決方案3. docker images顯示的鏡像過多,狗眼被亮瞎了,怎么辦?4. javascript - log4js的使用問題5. javascript - 移動端textarea不能上下滑動,該怎么解決?6. css - 對于類選擇器使用的問題7. javascript - 音頻加載問題8. javascript - 為什么這個點擊事件需要點擊兩次才有效果9. javascript - Ajax加載Json時,移動端頁面向左上角縮小一截兒,加載完成后才正常顯示,這該如何解決?10. javascript - 有沒有什么好的圖片懶加載的插件,需要包含監聽頁面滾動高度,然后再加載的功能
