我读过很多关于不同行业如何使用大数据分析的博客文章。但这些文章大多没有提及这些公司使用了什么样的数据。数据的大小是多少他们用什么样的工具和技术来处理数据他们面临的问题是什么?他们获得数据的洞察力如何帮助他们解决问题。他们如何选择适合自己需要的工具\技术。他们从数据中发现了什么样的模式&他们从数据中看到了什么样的模式。我想知道是否有人能给我提供所有这些问题的答案,或者至少能回答其中一些问题的链接。如果有人能分享金融业是如何利用大数据分析的,那就太好了。
eoxn13cs1#
你的问题很大,但我会用自己的经验来回答这些公司使用了什么样的数据?hadoop的优点之一是可以使用非常大的数据源。它可以是.csv/.txt文件、json、mysql、照片、视频。。。它可以包含有关营销、社交网络、服务器日志。。。数据的大小是多少?这是没有规定的。它可以从50-60到1po。取决于数据和公司。2-他们使用什么样的工具和技术来处理数据对此没有规定。视需要而定。为了组织和处理数据,他们使用hadoop和hive和pig。为了查询数据,他们需要一些较短的响应时间,所以他们使用nosql/内存数据库和较短的数据集(由hadoop优化)。在某些情况下,公司使用类似talend的etl来加快速度。3-他们面临的问题是什么,他们获得数据的洞察力如何帮助他们解决问题。公司面临的主要问题是数据的增长。目前,数据太大,无法使用mysql等传统工具进行处理。所以他们开始使用hadoop作为例子。4-他们如何选择适合自己需要的工具\技术。我认为这是一个内部问题。公司选择他们的工具是因为许可证的价格,他们自己的技能,他们的最终需求。。。5-他们从数据中发现了什么样的模式&他们从数据中看到了什么样的模式。我不太明白这个问题希望对你有帮助。
esbemjvw2#
我认为从不同的资源中一点一点地获取数据是一件困难的工作。请务必访问以下链接:一堆免费的报告。我正在研究名单。http://www.oreilly.com/data/free/著名的麦肯锡报告:http://www.mckinsey.com/~/media/mckinsey/dotcom/insights%20and%20pubs/mgi/research/technology%20and%20innovation/big%20data/mgi_big_data_full_report.ashx
2条答案
按热度按时间eoxn13cs1#
你的问题很大,但我会用自己的经验来回答
这些公司使用了什么样的数据?
hadoop的优点之一是可以使用非常大的数据源。它可以是.csv/.txt文件、json、mysql、照片、视频。。。
它可以包含有关营销、社交网络、服务器日志。。。
数据的大小是多少?
这是没有规定的。它可以从50-60到1po。取决于数据和公司。
2-他们使用什么样的工具和技术来处理数据
对此没有规定。视需要而定。为了组织和处理数据,他们使用hadoop和hive和pig。为了查询数据,他们需要一些较短的响应时间,所以他们使用nosql/内存数据库和较短的数据集(由hadoop优化)。在某些情况下,公司使用类似talend的etl来加快速度。
3-他们面临的问题是什么,他们获得数据的洞察力如何帮助他们解决问题。
公司面临的主要问题是数据的增长。目前,数据太大,无法使用mysql等传统工具进行处理。所以他们开始使用hadoop作为例子。
4-他们如何选择适合自己需要的工具\技术。
我认为这是一个内部问题。公司选择他们的工具是因为许可证的价格,他们自己的技能,他们的最终需求。。。
5-他们从数据中发现了什么样的模式&他们从数据中看到了什么样的模式。
我不太明白这个问题
希望对你有帮助。
esbemjvw2#
我认为从不同的资源中一点一点地获取数据是一件困难的工作。请务必访问以下链接:
一堆免费的报告。我正在研究名单。http://www.oreilly.com/data/free/
著名的麦肯锡报告:http://www.mckinsey.com/~/media/mckinsey/dotcom/insights%20and%20pubs/mgi/research/technology%20and%20innovation/big%20data/mgi_big_data_full_report.ashx