学习大数据难易程度如何？（mongodb单机查询速度怎么提高）

学习大数据难易程度如何？

看到这个问题，忍不住的想说两句，主要是想说说自己最近学习大数据的感受！原先一直想学习大数据，但总感觉忙抽不出时间学习，从去年开始下定决心，开始学习大数据。下面说一个个人的一些感受！

最初，认为从官网下载一些资料学习学习就可以了。于是下载了hadoop开始进行环境搭建。搭建了单机、伪分布式和分布式。看看Hadoop主要包含哪些东西。从官网看了些资料，看完之后，感觉还是不怎么理解，感觉这要学的东西太多了。

感觉学了一段时间，效果不佳，开始找资料。从51cto、CSDN等找资料学习，学习之后有了一个大体的了解。基本学完了common、hdfs、mapReduce（mr）、yarn等几部分，以及这几部分的关系。

大数据不是一个框架，大数据是一个生态，需要学习的东西，比想象的要多的多。后面就开始找视频资料进行系统的学习。逐渐了解到大数据需要掌握的基础知识包括java编程基础、Linux基础知识。hadoop的hdfs、mr以及yarn。后面的数据仓库Hive，序列号编解码Avro、Protobuf。分布式框架zookeeper。大数据数据库Hbase。大数据日志采集Flume。消息队列Kafka。大数据实时处理Storm。大数据实时计算spark及其相关编程语言scala。一般还要web开发的ssh或ssm框架等。

最后，想说知识虽然多，但只要坚持学习，总会有所收获。编程需要多动手，多实践，有助于你学习知识，加深理解。

本人具有多年的java开发经验，熟悉多种框架，熟悉网络编程，熟悉java安全编程，熟悉大数据，熟悉多种安全协议，熟悉并发编程，有兴趣的同学可以互相关注，互相学习！！！

大数据的学习还是挺难的，因为涉及的东西比较广比较多，你要学习统计学的相关知识，还有学习人工智能方面的。比如一些数据库管理系统MySQL， MongoDB，开源、支持网络、基于内存、键值对存储数据库Redis，还有python，liunx，hadoop等等。勤能补拙，路漫漫，好好学习，发展很好。

大数据技术的体系庞大而且复杂，涉及的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。如果真的决定入行大数据，需要做好长期的攻坚准备。

mysql数据表规模九千万左右，怎么优化查询？

是一张表九千万了吗？

建议：

第一、表读居多还是写？读的话数据库引擎用myisam ，写的话InnoDB 而不是MyISAM，因为MyISAM有太多锁。

第二、升级到MySQL 5.5 ，确保使用buffering功能。

第三，索引确保使用正确，且都在内存中，移除没有必要的索引。

第四、写场景多吗？设置innodb_buffer_pool_size足够大来确保更快的写操作。

第五、按业务id取模，分表。

最后，花钱加机器内存和用ssd磁盘吧。

我不清楚答题的大部分人是否有真正实践过，特别是用mysql实践过。大部分说是加索引、调整参数不是说不正确，有效果，但是不能很好的解决问题。说说个人想法:

部分答主的方案的确不敢苟同，纠正如下：

1、select count(*) 和 select count(主键) 在现阶段的mysql 没有太大区别，新版mysql这个对性能影响可以忽略。

2、强烈反对使用存储过程，后面介绍了使用分表分库的方案，就更不要用存储过程了。

3、单表行数和表数量，需要找到平衡点。表太多，性能也会下降。

我的回答：

1、单表9000w数据，mysql存储不了，想办法分表分库。500w数据的时候，你就该有这个想法了。只加索引解决不了问题，9000w的单表数据，很难平衡查找和插入性能，索引稍微多了插入性能也很低。

2、不要再说select count了，放弃汇总查询的想法，根本查不了。

到此，以上就是小编对于mongodb 查询速度的问题就介绍到这了，希望这2点解答对大家有用。

分享标题：学习大数据难易程度如何？（mongodb单机查询速度怎么提高）
本文地址：http://www.shufengxianlan.com/qtweb/news5/367055.html

网站建设、网络推广公司-创新互联，是专注品牌与效果的网站制作，网络营销seo公司；服务项目有等

声明：本网站发布的内容（图片、视频和文字）以用户投稿、用户转载内容为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。电话：028-86922220；邮箱：631063699@qq.com。内容未经允许不得转载，或转载时需注明来源：创新互联

猜你还喜欢下面的内容