手写linear-regression预测PM2.5

作业要求
image

image

数据集

image
每个月记录20天,每天记录20个小时,总共有18个特征(PM2.5包括在其中)
image
需要用前9个小时预测第十个小时的PM2.5监测值

数据预处理

首先读取数据集

import pandas as pd import numpy as np data = pd.read_csv(r"C:UsersAdministratorDesktop机器学习深度学习day1hw1hw1train.csv") 

发现读了个倒着的进来(读了繁体字),但.columns和.values没有问题,那数据也没问题,可以用朴素的代码去解决这个问题(

image

尝试着把有问题的列名改了,然后就好了:

data.rename(columns={data.columns[0]:'日期',data.columns[1]:'测站',data.columns[2]:'测项'},inplace=True) 

image


首先把RAINFALL里面的数据看看:

s = set() for i in range(0,len(data.values)):     if data.values[i][2]=='RAINFALL':         for j in range(3,len(data.values[i])):             s.add(data.values[i][j]) 

发现除了'NR'以外其他均为实数,把'NR'变成0

#data[data == 'NR'] = 0 for i in range(0,len(data.values)):     if data.values[i][2] == 'RAINFALL':         for j in range(3,len(data.values[i])):             if data.values[i][j] == 'NR':                 data.values[i][j] = 0 

这样就把RAINFALL里面的非实数消除了
image


然后把

推荐这些文章:

手写linear-regression预测PM2.5

作业要求 数据集 每个月记录20天,每天记录20个小时,总共有18个特征(PM2.5包括在其中) 需要用前9个小时预测第十个小时的PM2.5监测值 数据预处理 首先读取数据集 import pandas as pd import numpy as np data = pd.read_csv(r"C:UsersAdministratorDesktop机器学习深度学习day1hw1hw1train.csv") 发现读了个倒着的进来(读了繁体字),但.columns和.values没有问题,那数据也没问题,可以用朴素的代码去解决这个问题( 尝试着把有问题的列名改了,然后就好了: dat...

手写linear-regression预测PM2.5

作业要求 数据集 每个月记录20天,每天记录20个小时,总共有18个特征(PM2.5包括在其中) 需要用前9个小时预测第十个小时的PM2.5监测值 数据预处理 首先读取数据集 import pandas as pd import numpy as np data = pd.read_csv(r"C:UsersAdministratorDesktop机器学习深度学习day1hw1hw1train.csv") 发现读了个倒着的进来(读了繁体字),但.columns和.values没有问题,那数据也没问题,可以用朴素的代码去解决这个问题( 尝试着把有问题的列名改了,然后就好了: dat...

作业一-手写Linear-Regression&Gradient Descent预测PM2.5

前情提要:

本文刚过strong baseline,入门水平

第一个作业是手写线性回归+梯度下降预测PM2.5,某acm退役人终于不能拿不会sklearn当做不写的理由了(((
当然纯C++选手之前完全没有写过python,也没写过机器学习算法,需要参考课程范例以及一些前人的经验
主要参考课程样例,差不多是跟着这个做的(为什么进不去懂的都懂)
部分参考这个博客

作业要求

数据集

每个月记录20天,每天记录20个小时,总共有18个特征(PM2.5包括在其中)

需要用前9个小时预测第十个小时的PM2.5监测值
数据预处理
首先读取数据集
import pandas as pd
i...

pandas随机创建数据

import numpy as np

date = ['20210912', '20210922', '20211009', '20211102']
new_date = []
for i in range(100):
new_date.extend(date)
new_data = []
for i in range(400):
new_data.append(np.random.random(1))

data = pd.DataFrame(columns=['date', 'data'])
data['date'] = np.array(new_date)
data[...

根据财政收入数据选择合适的时序模型和合适的预测方法

1对数据进行分析:代码如下
import numpy as npimport pandas as pdinputfile = 'file:///D:/桌面/data(1)/data.csv' # 输入的数据文件data = pd.read_csv(inputfile) # 读取数据# 描述性统计分析description = [data.min(), data.max(), data.mean(), data.std()] # 依次计算最小值、最大值、均值、标准差description = pd.DataFrame(description, index = ['Min', 'Max', '...

Jupyter中显示数据data时只显示省略号不显示完整数据

在开头导入pandas后加入以下:
#设置行不限制数量pd.set_option(‘display.max_rows’,None)
#设置列不限制数量pd.set_option(‘display.max_columns’,None)
#设置value的显示长度为100,默认为50pd.set_option(‘max_colwidth’,100)

...

对数据选择合适的时序模型和合适的预测方法

分析数据

import numpy as np
import pandas as pd

inputfile = 'data.csv' # 输入的数据文件
data = pd.read_csv(inputfile) # 读取数据

# 描述性统计分析
description = [data.min(), data.max(), data.mean(), data.std()] # 依次计算最小值、最大值、均值、标准差
description = pd.DataFrame(description, index = ['Min', 'Max', 'Mean', 'STD']).T # 将...

为数据选择合适的时序模型和预测方法

原始数据如下(data.csv):

 
由此可以得到特征值:

x1
社会从业人数
  X2
在岗职工工资总额

X3
社会消费零售总额
X4
城镇居民人均可支配收入

X5
城镇居民人均消费性支出
X6
年末总人口

X7
全社会固定资产投资额
X8
地区生产总值

X9
第一生产值
X10
税收

X11
居民消费价格指数
X12
第三产业与第二产业产值比

X13
居民消费水平
Y
财政收入

一、数据分析
1、数据分析:

import numpy as np
import pandas as pd

inputfile = 'D:/ISS/...

Python数据挖掘之时序模型预测

Python数据挖掘之时序模型预测
一、单变量序列预测

from statsmodels.tsa.arima.model import ARIMA
import pandas as pd
import numpy as np
data = pd.read_excel('E:\桌面\作业\py/new_reg_data_GM11.xls')

data_y = data['y']
data_y = data_y.dropna()

model = ARIMA(data_y, order=(1,1,1))
model_fit = model.fit()

print('模型报告为:\n', m...

20220320-day9:enumerate替换len方法显示索引

原来的实现方法:
data_list = [11, 22, 33, 44, 55]for index in range(len(data_list)): print(index+1, data_list[index])
新的实现方法:
data_list = [11, 22, 33, 44, 55]for i, item in enumerate(data_list, 1): print(i, item)

 
 
 

...

文章标题:手写linear-regression预测PM2.5
文章链接:https://www.dianjilingqu.com/1603.html
本文章来源于网络,版权归原作者所有,如果本站文章侵犯了您的权益,请联系我们删除,联系邮箱:saisai#email.cn,感谢支持理解。
THE END
< <上一篇
下一篇>>