请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册
首页 社区 Python 利用分箱光滑技术可以进行什么

利用分箱光滑技术可以进行什么

猿梦 2023-1-5 11:37:57
给定一个数据集waitakere.txt,该数据集中含有大量的噪音数据。具体操作要求:1)该数据集的偶数位均为噪音数据,判断偶数位是否为0,若为0,利用1替换。2)对转换后的数据集进行排序,利用分箱技术来光滑数据。假设有10个桶,实现“用箱均值光滑”、 “用箱中位数光滑”、“用箱边界光滑”三种技术。waitakere.txt:这只是一部分数据,只是为了示例噪音数据1 0 3 2 0 34 0 1 0 0 00 0 0 1 0 00 0 0 0 7 00 8 9 0 9 00 6 0 5 0 36 0 7 0 1 0......登录后复制解题思路:首先读入数据到列表里,然后对数据进行排序,将数据划分到10个箱中。对于箱均值光滑,箱中每一个值都被替换为箱中的均值。对于箱中位数光滑,箱中每一个值都被替换为箱中的中位数。对于箱边界光滑,箱中每一个值都被替换为最近的边界值。以下为python代码实现部分:import numpy as npdef binning(filename,box_num):my_list=[]my_list1=[]noise_data = open(filename)for line in noise_data.readlines():dataline=line.strip()my_list.append(dataline)for i in range(0,len(my_list)):my_list[i]=int(my_list[i])if (i+1) % 2==0 and my_list[i]==0:my_list[i]=1my_list1=sorted(my_list)#print my_list1box_list=[]len_box=int(np.ceil(len(my_list1)/float(box_num)))for i in range(0,10):each_box=my_list1[i*len_boxi+1)*len_box]box_list.append(each_box)return box_listdef box_mean_smooth(box_list):for i in range(0,len(box_list)):box_avg=int(np.average(box_list[i]))for j in range(0,len(box_list[i])):box_list[i][j]=box_avgreturn box_listdef box_mid_smooth(box_list):for i in range(0,len(box_list)):box_mid=int(np.median(box_list[i]))for j in range(0,len(box_list[i])):box_list[i][j]=box_midreturn box_listdef box_boundary_smooth(box_list):for i in range(0,len(box_list)):left_bdy=box_list[i][0]right_bdy=box_list[i][-1]for j in range(0,len(box_list[i])):if abs(box_list[i][j]-left_bdy)<abs(box_list[i][j]-right_bdy):box_list[i][j]=left_bdyelse:box_list[i][j]=right_bdyreturn box_listfilename='waitakere.txt'box_list=binning(filename,10)print box_listprint box_mean_smooth(box_list)print box_mid_smooth(box_list)print box_boundary_smooth(box_list)登录后复制下图为实验结果截图:由于数据较多,截图只是一部分python数据银川旅游景点攻略,这个地方驴友必去之一!良心推荐精选推荐广告python 等深分箱法(均值平滑技术、边界值平滑技术)1.3W阅读·6评论·24点赞2020年12月10日数据挖掘概念与技术(第三版)课后答案——第三章2.2W阅读·201评论·119点赞2020年7月3日python S-G (Savitzky–Golay filter) 平滑滤波和kalman滤波滤掉噪声实现实例,有可视化结果357阅读·0评论·0点赞2022年11月10日R语言数据挖掘(2) 数据预处理2292阅读·0评论·1点赞2017年10月10日数据认知与数据预处理--数据预处理348阅读·0评论·0点赞2022年6月23日数据挖掘复习815阅读·0评论·0点赞2021年12月20日美人鱼公主参加聚会装扮美人鱼游戏精选推荐广告python 数据、曲线平滑处理9904阅读·0评论·16点赞2022年4月21日数据挖掘如何分箱以及如何对每个箱子中的数据进行平滑处理2.0W阅读·2评论·38点赞2019年6月24日数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第三章课后习题答案2.6W阅读·13评论·21点赞2017年5月21日python 数据可视化 -- 真实数据的噪声平滑处理2779阅读·0评论·2点赞2019年2月11日【6】python生成数据曲线平滑处理——(Savitzky-Golay 滤波器、convolve滑动平均滤波)方法介绍,推荐玩强化学习的小伙伴收藏2612阅读·2评论·3点赞2021年8月12日数据挖掘理论与算法笔记368阅读·0评论·0点赞2021年6月10日《数据挖掘概念与技术》学习笔记-第三章3957阅读·0评论·6点赞2020年2月14日这个神奇的库,可以将数据平滑化并找到异常点135阅读·0评论·0点赞2022年6月9日python数据平滑处理,numpy之数据平滑处理3253阅读·0评论·0点赞2021年4月27日python 数据平滑_数据平滑方法的原理和应用1394阅读·0评论·0点赞2020年12月9日python使曲线变得平滑_如何在Python中平滑数据?3234阅读·0评论·1点赞2020年12月4日numpy模块的使用(二)257阅读·0评论·2点赞2020年10月3日去首页看看更多热门内容评论1扣尼奇哇赞写得好
门锁尹晓露抓紧时间!孤头发抹掉痕迹#利用分箱光滑技术可以进行对转换后的数据集进行排序。

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册