站内搜索
热门关键字: 创新 国有企业 企联 企联活动 企业 四川省
四川企联网新闻中心 > 数字化 > >> 五个真实的大数据挖掘故事

五个真实的大数据挖掘故事

编辑:企联编辑来源:《中国企业家》杂志 评论数:0发布时间:2013-04-13 22:34:09

大。同时内容竞争越来越激烈,尽管在流媒体播放领域Netflix仍占据市场首位,但面临着HBO(美国家庭电视广播网)、Amazon(亚马逊)、Hulu、YouTube的竞争,它们都在加大内容投入。

  由于版权价格提升,国内知名的视频网站们,诸如优酷土豆、搜狐视频、乐视网、爱奇艺近两年也纷纷打造自制剧。

  据乐视网高级副总裁高飞对本刊透露,虽然去年上半年版权价格曾达冰点,但是现在又很快回升,从一线卫视购买电视剧,平均购买价格每集几十万,意味着买下一整部剧不下千万。在此局面下,拿下《纸牌屋》中国地区的互联网独家播放权的搜狐视频,不得不上调版权采购预算,其2012年的版权采购成本为5000万美元,但2013年这一预算上调到8000万美元。“但我们拍一个自制剧,成本基本上也就三分之一,甚至不到这个数。”高飞说。

  关键是如何制作自制剧?国内视频网站意识到数据的重要性,也积累了大量数据。比如乐视网通过分析用户收看时间,在今年推出午间自制剧场。“但真正细致到使用数据来决定导演、演员,中国还没有哪家公司敢说他们能做到这点。”何凤云说。

  此外,即便是有了数据,中国的流媒体公司还不敢像Netflix那样将宝押在一部剧上,因为中国的付费市场尚未成熟,目前还主要依赖广告盈利,无法完全将用户需求作为中心。“Netflix选择了这个项目,投巨资去做,就是博一个必须赢。”乐视网高级副总裁高飞对《中国企业家》说,“期待中国市场也可以通过付费收视足以覆盖成本,但这要寄希望于未来大屏电视以及电视平台产品和服务的成熟,以及付费市场的快速成长。”

  除此以外,一位视频行业的人士指出,在中国基于用户数据做出分析的同时,还要考虑广电审核的要素,一些领域与题材类型都要稍微收拢,“不是没法依赖数据,而是不能完全依赖数据,我们选择数据时也一定要结合中国国情。”


     案例5:定制爱情

  发挥你您的想象力,选择您认为可是的答案

  文_本刊记者 李春晖 编辑_王琦

  文_本刊记者 李春晖 编辑_王琦

  宅男们总幻想为自己定制一个女朋友,也许他们的愿望将不日达成。不是借助3D打印机,而是靠大数据时代的婚恋网站。

  2012年底,网易旗下全新婚恋交友网站“花田”上线。花田以免费沟通为卖点,主打一二线城市中高端市场。摒弃了传统婚恋网站的“人工红娘”,花田不提供任何人工服务,从推荐到搜索全由系统自动完成。而业内的龙头老大世纪佳缘(Nasdaq:DATE),也在换帅之后摩拳擦掌,试图用大数据的精准化运营,为在海量异性资料中疲于搜索的用户“指一条明路”。

徘徊的大数据门前:五个真实的数据挖掘故事

  一年前婚恋网站最爱喊“实名制”。通过对用户身份证或手机号码进行验证,网站可获得用户真实姓名、年龄、性别、地区等身份证数据,对防止诈骗有一定作用。但如今各家都有,这种传统打法就过气了。毕竟有身份证的人,不一定是有身份的人。婚恋网站已将条条框框的硬指标罗列齐全,使人几乎怀疑进入的是淘宝人肉市场。当身高、体重、年龄、学历等等都一一框定,一看还有2000个姑娘(小伙)符合要求,是时候让理性回归感性了。而这感性,又是建立在理性的数据分析之上。

  花田界面清新简洁,采用类似微博的信息流展示形式。首页是异性用户最近更新的图片、内心独白和文字传情,展示其生活方式、个人品味等软性资料。系统会自动推荐那些相对活跃、最近有信息流更新的人,这就促使用户拿出更新微博的劲头来更新花田,为花田积累了大量可供分析的软性数据。

徘徊的大数据门前:五个真实的数据挖掘故事

  “我们可以通过‘内心独白’来挖掘用户的性格特征。”网易花田负责人夏天宇说。夏天宇在网易已工作11年,此前他的团队负责网易微博的研发,而他最早的工作是Oracle数据库管理。

  现在,他和他的团队正试图通过自然语言处理技术和语义分析方法来解码用户性格,实现“软硬兼施”的精准推荐。首先,他们运用切分词方法,从用户的“内心独白”中提取出现频率较高的关键词;再将这些关键词分类,如感性词汇或理性词汇;最后,通过文本分析、语义分析,从中挖掘出用户的性格是内向、外向、理想化还是现实派等等。这一技术目前还在测试中,2013年下半年会逐步投入使用。

徘徊的大数据门前:五个真实的数据挖掘故事

  自2012年12月28日向全国开放注册以来,花田注册用户已近25万,每日活跃用户4万人。虽然发展迅速,但较之业界前辈,花田用户少得甚至吸引不来骗子。但网易的技术储备却不容小觑。“有道”搜索提供的自然语言处理技术,被用于通过文本挖掘用户性格。网易自研的原本用于网易邮箱的人脸识别技术,更是婚恋网站求之不得的利器。

  花田团队只有30多个人,大多是85后。他们在对海量软硬数据进行分析的基础上,总结出一些人物特征,建立出一定数量的人物模型。再分析具体用户,将其分门别类套入各种模型。这样,用户心仪其中某一个人,便可向其推荐这一类人。

  这种模型不仅是性格模型,还包括外貌模型。“我们马上要推出人脸识别。比如你想找个像范冰冰的女生,你输入范冰冰,就会推荐给你很多范冰冰脸型的女生。”夏天宇介绍,花田的后台已经提取出范冰冰脸型的数据,之后还会推出几十种流行的男女明星脸型供用户选择。

徘徊的大数据门前:五个真实的数据挖掘故事

  更令人感兴趣的是,如果花田能够跨产品平台,结合网易门户、邮箱、游戏等其它网易资源进行大数据分析,是否就能向用户推荐与自身阅读习惯、工作习惯、娱乐习惯都匹配的对象呢?真正的大数据必然是跨平台的,而这点别家很难做到。

  但跨平台数据提取在一定程度上又涉及用户隐私。大数据的底线在哪里?夏天宇认为,涉及到银行的数据绝对不可碰触。这个范围就很广泛。不过可以确定的是,网易不会在花田影响力和用户量都不足的时候开启跨平台数据分析。

  “我希望花田能盖一个五层楼,每层装不同类别的人。一个收入五万块的人进来,也不感觉这里有很多屌丝。”夏天宇这样描述自己对花田的愿景。虽然少了王子配灰姑娘的浪漫童话,倒也实实在在为用户省去不少筛选麻烦。

数据分析不只可用于精准推荐,还能识别婚恋网站最为人诟病的造假和诈骗。2012年底,创始人龚海燕辞任世纪佳缘联席CEO后,另一联席CEO吴琳光担任CEO。吴琳光曾在空中网担任副总裁兼手机游戏事业部总经理。加入世纪佳缘后,他首先做的就是引

相关热词搜索: 五个真实数据挖掘
上一页 1 2 3 4 5 6 7 下一页
活动预告更多>>
省企联动态更多>>
高层参考更多>>
财经观察更多>>
聚焦企业更多>>