运用pandas matplotlib进行服务器日志分析
1、导包 import matplotlib.pyplot as plt import numpy as np import pandas as pd 2、log日志读取 简单分析日志文件,查看日志的数据结构,主要是分隔方法,发现是以\t分隔的 df = pd.read_csv(’./log.txt’, header = None, sep = ‘\t’) df.head() #查看前5条数据 log日志没有标题行,所以header为空,sep是分隔符的类型 3、数据优化 3.1、查看内存占用 log日志中记录了大量数据,并不是都有用,无用的数据会占用内存,降低运行效率。 使用df.info
用户评论