当前位置: 首页 > news >正文

网站建设拟采用的技术路线深圳网站建设三把火科技

网站建设拟采用的技术路线,深圳网站建设三把火科技,武汉网站建设企业,杭州建设厅官网【2023美赛】C题Wordle预测27页中文论文及Python详解 相关链接 (1)2023年美赛C题Wordle预测问题一建模及Python代码详细讲解 (2)2023年美赛C题Wordle预测问题二建模及Python代码详细讲解 (3)2023年美赛C题…

【2023美赛】C题Wordle预测27页中文论文及Python详解

在这里插入图片描述

相关链接

(1)2023年美赛C题Wordle预测问题一建模及Python代码详细讲解
(2)2023年美赛C题Wordle预测问题二建模及Python代码详细讲解
(3)2023年美赛C题Wordle预测问题三、四建模及Python代码详细讲解
(4)2023年美赛C题Wordle预测问题25页论文

1 论文简介

在这里插入图片描述

1.1 问题一

通过解读问题,其中需要解决两个问题,第一小问为了对2023年3月1日的 Number of reported results进行预测,并创建一个预测区间。这是一个时间序列预测问题,本文建立机器学习模型进行时间序列数据回归预测。对于时间序列的回归预测,线性回归模型需要满足线性、独立性、正态性、方差齐性、自变量间不存在多重共线、因变量为连续变量。所以首先要对数据进行数据分析,查看数据的分布、异常值、是否存在季节性趋势和。正态分布检验是计算偏度(skewness)和峰度(kurtosis)。偏度能够反应分布的对称情况,若以bs表示偏度。bs<0称分布具有负偏离,也称左偏态,此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于与右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长;bs>0称分布具有正偏离,也称右偏态,此时数据位于均值右边的比位于左边的少,直观表现为右边的尾部相对于与左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长;而bs接近0则可认为分布是对称的。是指反应的是图像的尖锐程度。峰度越大,表现在图像上面是中心点越尖锐。峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。对于异常值可以采用以箱线图查看,异常值的处理有填充法和删除样本的方法,但在时间序列中,优先考虑填充的方法,填充的方法又向前填充、中位数填充、平均数填充以及众数填充。

其次,需要进一步做特征工程,特征工程是将原始数据转化成更好的表达问题本质的特征的过程,使得将这些特征运用到预测模型中能提高对不可见数据的模型预测精度,包括对时间特征进行信息提取、提取不同长度的滑动平均值、标准差等特征,提高机器学习模型的拟合能力。在此基础上,选择多种机器学习模型进行回归预测,并可以通过K折验证来防止模型过拟合。最后,预测阶段计算模型测试集误差,将预测结果减去误差,得到预测区间的最低值,加上预测结果的误差,得到预测区间的最高值。

第二小问需要分析单词的属性是否会影响困难模式下玩家得分的百分比。首先,单词的属性有元音、辅音、字母序号、字母顺序、词性。将字母频率、字母序号、字母顺序、元音、辅音编码后分析与7种百分比的分析相关性,可视化相关性,得出结论。
在这里插入图片描述

1.2 问题二

通过解读问题,其中需要解决两个问题,第一小问需要在开发一个时间序列预测模型,能够预测报告结果的分布,即预测未来日期(1,2,3,4,5,6,X)的相关百分比。首先,针对1-7种尝试,建立7个回归模型,特征工程部分包括提取百分比的数据特征,包括滑动平均值、窗口标准差,获取时间特征,以及将字母频率、字母序号、字母顺序、元音、辅音编码行编码作为类别特征,采用机器学习的回归模型,进行预测7种情况的百分比。其次,大部分特征可能存在多重共线性,数据存在多重过线性,会导模型容易过拟合,或者导致模型无法解释。去除共线性特征的方法有画图法定性分析、相关法定量分析、方差膨胀系数分析、Principal Component Analysis (PCA)分析、相关法迭代分析。然后将数据标准化后,才能将数据作为训练集和测试用来训练和测试模型。回归模型有线性回归、多项式回归、逐步回归、岭回归、Boost模型XGBoost和融合模型LightGBM回归。最后,题目中要求评价模型的性能,可以采用多重误差评价方法,包括均方误差(Mean Squared Error,MSE),均方根误差(Root Mean Squard Error,RMSE)以及平均绝对误差(Mean Absolute Error,MAE)。

在这里插入图片描述

1.3 问题三

题目中要求建立一个模型,对单词进行分类,我们采用机器学习中的聚类方法,对单词进行编码后,采用K-Means(K均值)聚类、均值漂移聚类、基于密度的聚类方法(DBSCAN)、层级聚类算法、(EM)聚类或者图团体检测(Graph Community Detection),将单词难度分为三类或者更多,如困难、一般、简单。然后对每一类的单词可视化分析,并描述数据得出结论。并分析EERIE的类别,以轮廓系数等评价方式评价聚类效果的好坏。

在这里插入图片描述

2 下载方式

betterbench.top/#/45/detail
在这里插入图片描述

http://www.qdjiajiao.com/news/10969.html

相关文章:

  • 中国安能建设集团有限公司网站在线检测网站安全
  • 网站建设泉州app开发公司
  • 建设门户网站特点网络推广主要内容
  • 网站获取客户信息需要备案吗手机建站平台
  • 淘宝客怎么建立网站广州网站推广运营
  • seo建站淘客企业网站建设方案策划书
  • 做网站资料网络营销属于什么专业类型
  • alexa排名软件seo外包收费
  • 做购物网站的数据库搜索引擎优化工具
  • 网站前台图片设置google图片搜索引擎入口
  • 相亲网站男人拉我做外汇国际新闻最新消息中国
  • 谁有做爰网站号惠州自动seo
  • 武汉市有做网站的吗网络推广精准营销推广
  • 网站改版 301跳转国外搜索引擎大全百鸣
  • 做起点说网站的服务器多少钱网站快速优化排名app
  • 建立网站目录结构的原则百度站长社区
  • js 网站源码香港旺道旺国际集团
  • 做网站业务员应该了解什么网络seo外包
  • 浏览网站时弹出的广告是谁给做的关键词词库
  • 全球新冠疫情最新消息今天青岛百度推广优化
  • 深圳做网站设计的公司成都网站建设方案服务
  • 淄博市 网站建设报价怎样推广app别人才愿意下载
  • 全国做网站哪家好四川网络推广seo
  • 网站建设中 模板下载58黄页网推广公司
  • 个人网站建站指南15个常见关键词
  • 政府网站建设规范小红书外链管家
  • 有域名后怎样做网站优化seo教程
  • 用dreamever如何建设网站seo服务 文库
  • 网站优化设计宣传推广计划怎么写
  • 大安区网站建设网络广告销售