大数据中社会学的重要性讲解
IDG资本
123 慧聪国际(慧聪16网74)H 批发和零B2售B业 中国 北京 北京市
IDG资本
123 慧聪国际(慧聪16网74)H 批发和零B2售B业 中国 北京 北京市
IDG资本
123 慧聪国际(慧聪16网74)H 批发和零B2售B业 中国 北京 北京市
达晨创投 385 金银岛网交所 1916 H 批发和零B2售B业 中国 北京 北京市
大
网社 交
及 转 贴
数 据
网
I
IV
语词选择,频次转发
社会网结构(整体网、个人网)
II
心理与行为 社会结构
一个计算社会学的方法
大数据分析的推论之一: 寻找指标的模型
案例一:谁是艾滋高危人群
Daily work
Make friends
True Love
Tim
…
They are interacting
DCM结合停止投资。
陈腾华表示,本轮资金将主要用户招募员工、做品类优化以及产品开发方面。
“文雅100”()定位于在线的时髦家居生活馆,目前仅仅上线2个月左右,主要销售自
有品牌家纺类产品以及其他品牌类的床品、毛巾浴巾等家纺用品。
谈及为何离任并进入家纺B2C时,陈腾华表示这个市场范围每年可以到达7000-8000亿元,目前
2012-03-12 08:46 中国风险投资网0 【导读】家纺B2C电子商务网站文雅100开创人陈腾华称,其曾经完成第一轮1000万美圆融资,由
IDG和DCM结合停止投资。他以为家纺业B2C年销售额应当在将来两三年内有大幅增长,也希望文雅 100做到家纺B2C的第一。
家纺B2C电子商务网站文雅100开创人陈腾华称,其曾经完成第一轮1000万美圆融资,由IDG和
Figure 1. 粗蓝线表示两周内互动二十次以上。细蓝线表示 两周内互动十次到二十次之间。细灰线表示两周内互动十 次以下
Figure 2 粗蓝线表示两周内互动五十四次以上。
黄绿一有黄绿一有色色下三色色下三点点降个点点降个为为为点为为为点受对了存受对了存访应八留访应八留者的月在者的月在下下其3,下下其3旬半网,蓝旬半网的旬络蓝色的 旬 络三的上色和三 的 上。个 边和绿。个 边剩绿 缘绿色剩绿 缘下色 点色点下色 点的点 。点为的点 。全。 而为其全。 而部他8其一月部他8消从一月级上消从失8级上连半月失8掉连半月带旬上掉了带旬上点与半了。点与半,他旬。,他旬其连度其连度中接数中接数八的很八的很月大19月大1上的个9上的个旬点点旬点点的之中的之中三一,三一,个,只个,只
德丰杰
406 点视传媒 744 H 批发和零B2售B业 中国 上海 上海市
富达亚洲 483 阿里巴巴 137 H 批发和零B2售B业 中国 浙江 杭州市
富达亚洲 483 阿里巴巴 137 H 批发和零B2售B业 中国 浙江 杭州市
富达亚洲 483 阿里巴巴 137 H 批发和零B2售B业 中国 浙江 杭州市
B2C行业还没有质量家居生活的领头者。在传统市场又存在制造分散、品牌集中度分散等问题,因而
B2C在这方面就存在时机。
值得留意的是,除了作为平台出卖其他品牌家纺,文雅100还推出了自有品牌Toscaso。陈腾华以
为,垂直类B2C的一个开展趋向就是自有品牌,由于无论是制造、本钱还是质量和渠道都可以有效控制,
但是,很多研究需要推论
往往这样的分析只作归纳不作演译,得不到 很多有用的知识,以舆情观察为例,会产生 五大偏误:
一、抽样偏误。 二、情绪字词衡量偏误。 三、转化偏误--需要指标寻找模型 四、情绪感染偏误。 五、资料被截的偏误(truncated data bias)
--可以寻找行为模式的模型加以推估。
并且具有较高利润。
陈腾华表示固然有自在品牌,但不会做线下实体展现店。他以为家纺业B2C年销售额应当在将来两
三年内有大幅增长,也希望文雅100做到家纺B2C的第一。
2. Structure Data Base Collected from Big Data
投资机构 投资机构I获D 投企业 获投企业I行D 业代码 行业描述 国家 省份 城市
大数据分析中社会学的价值
--数据挖掘、理论与动态模型 的互动
罗家德 清华社会学系
大数据很有用 大数据一词提出者维克托•迈尔提出: 一、资料整合 二、最明显的就是茫茫网海中“盯”一个人 三、找一个聚类 四、我想找一个商机、事件。 五、只是描述性统计和相关性分析,不作任
何推论。 六、还有就是数据本身就是母体而不是样本
高盛
500 阿里巴巴 137 H 批发和零B2售B业 中国 浙江 杭州市
和利资本 616 卖买提
2560 H 批发和 H 批发和零B2售B业 中国 上海 上海市
I. 资料挖掘:预测变量
Feature selection
十大预测变量
相同国别 共同邻居数 中介中心性 距离 相同产权 投资领域数量 相同的投资领域数
大数据分析的推论之二: 寻找行为模式的模型
案例二、风险投资产业网的动态变 化模型
1. Big Data on Internet
/news/news?aid=32901285&vt=5&ch=rj_bd_me&mid=
DCM联合IDG向B2C网站优雅100投资1000万美元
资料来源 一年期w市同志qq群的资料(每两周 作一张网络图,共二十四张) 1893 受观察者,26 qq群 8位线下受访者
什么是419 (for one night)爱好者 最好的指标
计算机学者会提出: Degree Centrality Hole Spanner Cluster Coefficients K-Shell 那一个? 社会学家如何回答?
大数据统计推论的问题
大数据知道了what 但是Why? How? 一、Ground Truth问题 二、诠释和理论的不同 三、描述性统计和推论性统计不同 四、Data Mining和Theoretical
Hypothesis Testing的不同
集体行动与系统变化
III
复杂网结构演化