hadoop大数据分析仿真

holgip5t  于 2021-06-01  发布在  Hadoop
关注(0)|答案(1)|浏览(448)

有史以来的第一个帖子,我们开始吧(感谢您抽出时间阅读!)
我目前正在大学学习,从事一个研究项目,研究不同的硬件(特别是ram磁盘和硬盘)如何影响大数据分析的速度。我知道如何设置各种硬件和所有的爵士乐,但是,我以前没有大数据分析的经验,在找了几天之后,我也没有找到答案(即使在这里)。我需要任何能够模拟大数据分析的软件-我读过hadoop,但不知道从哪里开始-而且似乎即使有它也没有模拟。我怎样才能让软件和数据一起分析呢?具体来说,我可以作为一个控制组运行,然后再次使用存储在ram磁盘上的数据来查看性能是否有所提高。
我真的觉得在这里我的头,不知道从哪里开始,所以任何帮助或提示是欢迎的。非常感谢你!
为了澄清,我希望从一个非常小规模的数据库开始,但我也有资源与我的学校建立一个非常大的驱动器,以便能够测试。

6qfn3psc

6qfn3psc1#

市场上有很多db解决方案。然而,大数据数据库的设计必须能够处理这些特定的数据。大数据的特点概括为3v,即数据量大、速度快、变化大。大数据是指以tb或更多为单位的大量数据。这是大数据最基本的特点,也就是说还有大量的数据仍在通过多条路径生成。此外,必须根据用户的需要实时收集和分析大量数据。大数据的多样性有多种表现形式。也就是说,它包括所有类型的数据,例如规则、半规则和不规则数据。除了书籍、杂志、病历、视频、音频等传统的指导性数据外,还包括具有位置信息的数据。machbase数据库是一款可以尝试的大数据软件。这个数据库网站还提供了用户手册和入门页面,用户可以很容易地按照说明。祝你好运!!

相关问题