大数据案例研究或用例示例

fnatzsnv  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(369)

我读过很多关于不同行业如何使用大数据分析的博客文章。但这些文章大多没有提及
这些公司使用了什么样的数据。数据的大小是多少
他们用什么样的工具和技术来处理数据
他们面临的问题是什么?他们获得数据的洞察力如何帮助他们解决问题。
他们如何选择适合自己需要的工具\技术。
他们从数据中发现了什么样的模式&他们从数据中看到了什么样的模式。
我想知道是否有人能给我提供所有这些问题的答案,或者至少能回答其中一些问题的链接。
如果有人能分享金融业是如何利用大数据分析的,那就太好了。

eoxn13cs

eoxn13cs1#

你的问题很大,但我会用自己的经验来回答
这些公司使用了什么样的数据?
hadoop的优点之一是可以使用非常大的数据源。它可以是.csv/.txt文件、json、mysql、照片、视频。。。
它可以包含有关营销、社交网络、服务器日志。。。
数据的大小是多少?
这是没有规定的。它可以从50-60到1po。取决于数据和公司。
2-他们使用什么样的工具和技术来处理数据
对此没有规定。视需要而定。为了组织和处理数据,他们使用hadoop和hive和pig。为了查询数据,他们需要一些较短的响应时间,所以他们使用nosql/内存数据库和较短的数据集(由hadoop优化)。在某些情况下,公司使用类似talend的etl来加快速度。
3-他们面临的问题是什么,他们获得数据的洞察力如何帮助他们解决问题。
公司面临的主要问题是数据的增长。目前,数据太大,无法使用mysql等传统工具进行处理。所以他们开始使用hadoop作为例子。
4-他们如何选择适合自己需要的工具\技术。
我认为这是一个内部问题。公司选择他们的工具是因为许可证的价格,他们自己的技能,他们的最终需求。。。
5-他们从数据中发现了什么样的模式&他们从数据中看到了什么样的模式。
我不太明白这个问题
希望对你有帮助。

esbemjvw

esbemjvw2#

我认为从不同的资源中一点一点地获取数据是一件困难的工作。请务必访问以下链接:
一堆免费的报告。我正在研究名单。http://www.oreilly.com/data/free/
著名的麦肯锡报告:http://www.mckinsey.com/~/media/mckinsey/dotcom/insights%20and%20pubs/mgi/research/technology%20and%20innovation/big%20data/mgi_big_data_full_report.ashx

相关问题