当前位置:文档之家› 数学建模——数据搜集的方法

数学建模——数据搜集的方法


- 亚马逊 a w s- h t t p : / / a w s . a m a z o n . c o m / c n / d a t a s e t s / ? n c 1 = h _ l s  来自亚马逊的跨科学云数据平台,包含化学、生物、经济等多个领域的数据集。 - f i g s h a r e- h t t p s : / / f i g s h a r e . c o m /  研究成果共享平台,在这里你会发现来自世界的大牛们的研究成果分享,同时 g e t 其中的研 究数据,内容很有启发性,网站颇具设计感。 - g i t h u b- h t t p s : / / g i t h u b . c o m / c a e s a r 0 3 0 1 / a w e s o m e p u b l i c d a t a s e t s  2 . 数据交易平台 - 优易数据 - h t t p : / / w w w . y o u e d a t a . c o m /  由国家信息中心发起,拥有国家级信息资源的数据平台,国内领先的数据交易平台。平台有 B 2 B 、B 2 C两种交易模式,包含政务、社会、社交、教育、消费、交通、能源、金融、健康 等多个领域的数据资源。 - 数据堂 - h t t p : / / w w w . d a t a t a n g . c o m /  专注于互联网综合数据交易,提供数据交易、处理和数据 A P I 服务,包含语音识别、医疗健 康、交通地理、电子商务、社交网络、图像识 n d e x . b a i d u . c o m /   大家都很熟悉的指数查询平台, 可以根据指数的变化查看某个主题在各个时间段受关注的情 况,进行趋势分析、舆情预测有很好的指导作用。除了关注趋势之外,还有需求分析、人群 画像等精准分析的工具, 对于市场调研来说具有很好的参考意义。 同样的另外两个搜索引擎 搜狗、3 6 0 也有类似的产品,都可以作为参考。 - 阿里指数 - h t t p s : / / a l i z s . t a o b a o . c o m /   国内权威的商品交易分析工具,可以按地域、按行业查看商品搜索和交易数据,基于淘宝、 天猫和 1 6 8 8 平台的交易数据基本能够看出国内商品交易的概况,对于趋势分析、行业观察
意义不小。 - 艾瑞咨询 - h t t p : / / w w w . i r e s e a r c h . c o m . c n /  艾瑞作为老牌的互联网研究机构, 在数据的沉淀和数据分析上都有得天独厚的优势, 在互联 网的趋势和行业发展数据分析上面比较权威, 艾瑞的互联网分析报告可以说是互联网研究的 必读刊物。 - 友盟指数 - h t t p : / / w w w . u m e n g . c o m /  友盟在移动互联网应用数据统计和分析具有较为全面的统计和分析,对于研究移动端产品、 做市场调研、用户行为分析很有帮助。除了友盟指数,友盟的互联网报告同样是了解互联网 趋势的优秀读物。 - 爱奇艺指数 - h t t p : / / i n d e x . i q i y i . c o m /  爱奇艺指数是专门针对视频的播放行为、 趋势的分析平台, 对于互联网视频的播放有着全面 的统计和分析,涉及到播放趋势、播放设备、用户画像、地域分布、等多个方面。由于爱奇 艺庞大的用户基数,该指数基本可以说明实际情况。 - 猫眼专业版- h t t p : / / p i a o f a n g . m a o y a n . c o m /  电影票房统计分析平台,猫眼专业版有实时的票房统计,影片的排盘情况、上座率和影院数 据,对于当前电影的分析是必不可少的。 4 . 网络采集器 网络采集器是通过软件的形式实现简单快捷地采集网络上分散的内容, 具有很好的内容收集 作用,而且不需要技术成本,被很多用户作为初级的采集工具。 - 火车采集器 - h t t p : / / w w w . l o c o y . c o m /  一款专业的互联网数据抓取、处理、分析,挖掘软件,可以灵活迅速地抓取网页上散乱分布 的数据信息,并通过一系列的分析处理,准确挖掘出所需数据,最常用的就是采集某些网站 的文字、图片、数据等在线资源。接口比较齐全,支持的扩展比较好用,懂代码的话,可以 使用 P H P 或C # 开发任意功能的扩展。 - 八爪鱼 - h t t p : / / w w w . b a z h u a y u . c o m /  简单实用的采集器,功能齐全,操作简单,不用写规则。特有的云采集,关机也可以在云服
数学建模之数据搜集 2
以下内容来源于微信公众号来自数学建模 a n d M A T L A B
在这个用数据说话的时代, 能够打动人的往往是用数据说话的理性分析, 无论是对于混迹职 场的小年轻, 还是需要数据进行分析和研究的同学, 能够找到合适的数据源都是非常重要的。 特别是想要对一个新的领域进行研究和探索,拥有这个领域的数据是具有十分重要的意义。 在这里给大家推荐一些能够用上数据获取方式, 有了这些资源, 不仅可以在数据收集的效率 上能够得到很大的提升,同时也可以学习更多思维方式。 1 . 公开的数据库 - 国家数据 - h t t p : / / d a t a . s t a t s . g o v . c n / i n d e x . h t m  数据来源于中国国家统计局,包含了我国经济民生等多个方面的数据,并且在月度、季度、 年度都有覆盖,较为全面和权威,对于社会科学的研究不要太有帮助。最关键的是,网站简 洁美观,还有专门的可视化读物。 - C E I C- h t t p : / / w w w . c e i c d a t a . c o m / z h h a n s  最完整的一套超过 1 2 8 个国家的经济数据,能够精确查找 G D P , C P I , 进口,出口,外资直接 投资,零售,销售,以及国际利率等深度数据。其中的“中国经济数据库”收编了 3 0 0 , 0 0 0 多条时间序列数据,数据内容涵盖宏观经济数据、行业经济数据和地区经济数据。 - w i n d (万得)- h t t p : / / w w w . w i n d . c o m . c n /  万得被誉为中国的 B l o o m b e r g ,在金融业有着全面的数据覆盖,金融数据的类目更新非常快, 据说很受国内的商业分析者和投资人的亲睐。 - 搜数网 - h t t p : / / w w w . s o s h o o . c o m /  已加载到搜数网站的统计资料达到 7 , 8 7 4 本, 涵盖 1 , 7 6 1 , 0 0 9 张统计表格和 3 6 4 , 5 8 0 , 4 7 9 个统计 数据,汇集了中国资讯行自 9 2 年以来收集的所有统计和调查数据,并提供多样化的搜索功 能。 - 中国统计信息网 - h t t p : / / w w w . t j c n . o r g /  国家统计局的官方网站,汇集了海量的全国各级政府各年度的国民经济和社会发展统计信 息,建立了以统计公报为主,统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指 标排行等。
- 1 9 9 I T大数据导航 - h t t p : / / h a o . 1 9 9 i t . c o m /  - 数据分析网导航 - h t t p : / / w w w . a f e n x i . c o m / h a o  - 大数据人导航 - h t t p : / / h a o . b i g d a t a . r e n /  在互联网高度发达的今天, 数据资源异常的丰富和庞大, 如何高效地获取数据成为一种重要 的能力,毕竟获取数据是一切用数据说话的前提。当然往往只需要熟练掌握一两种方法,便 足够大多数人应付大多数场景和需求,所以选择合适的数据获取渠道还需要亲自探究。
务器上运行采集任务。 - 集搜客 - h t t p : / / w w w . g o o s e e k e r . c o m /  一款简单易用的网页信息抓取软件, 能够抓取网页文字、图表、超链接等多种网页元素,提 供好用的网页抓取软件、数据挖掘攻略、行业资讯和前沿科技等。 5 . 网络爬虫 作为极客们最喜欢的数据收集方式, 爬虫高度的自由性、 自主性都使其成为数据挖掘的必备 技能,当然精通 p y t h o n 等语言是必要前提。 利用爬虫可以做很多有意思的事情,当然也可以获取一些从其它渠道获取不到的数据资源, 更重要的是帮你打开寻找和搜集数据的思路。 - 利用爬虫爬取网络图片 -  爬取的图像素材 你看到某个网站上的图片恰好是你需要的, 但是量大单个下载太麻烦, 那么利用爬虫你可以 快速地进行抓取,并可以根据标签、特征、颜色等信息进行分类储存。从此不缺设计素材, 不缺美女图片,连斗图都多了几分自信。 - 利用爬虫爬取高质量资源 -  爬取的音乐资源 我们总是想快速地去搜集高质量的网络资源, 但是人工查找比对实在太麻烦, 利用爬虫你就 可以轻松解决。比如爬取知乎点赞最多的文章列表,爬取网易云音乐评论最多的音乐,爬取 豆瓣网高评分的电影或图书……总之,你可以从此拒绝平庸。 - 利用爬虫获取舆情数据 -  爬取的某招聘网站职位信息 比如你可以批量爬取社交平台的数据资源, 可以爬取网站的交易数据, 爬取招聘网站的职位 信息等,可以用于个性化的分析研究。 总之,爬虫是非常强大的,甚至有人说天下没有不能爬的网站,因而爬取数据也成为了很多 极客的乐趣。 开发出高效的爬虫工具可以帮助我们节省很多时间, 可以完全按照自己的需求 来订制,想想这个世界就太美好。 6 . 数据导航 收集数据是一种能力,学习收集数据也是一种能力,数据的来源是没有穷尽的,转换一种思 维,你就可以获得不一样的数据,下面推荐几个可以用到的大数据导航,从这里面你可能会 发现一些你自己想要的东西。 每个人喜欢的收集数据的渠道不尽相同, 只有尽量多地去见识 和实践才会发现更多的适合自己的数据获取方式。
相关主题