hadoop适合解决web 的高并发吗？

hadoop适合解决web 的高并发吗，一个网站有大量的用户访问，请问有什么好的解决办法？

推荐答案推荐于2018-04-13

hadoop适合处理分布式集群系统，本身是支持高速并发海量数据的写入和读取的。解决大量用户并发访问的方案有很多，给你个千万pv的参考方案：
1）架构中直接引入软件名称的模块，是个人推荐使用的，如Haproxy、Hadoop等；
2）关于全局负载均衡，看成本投入情况，可以使用商业的产品，如F5-GTM，开源方案便是自搭智能DNS；
3）本地负载均衡方案，可以考虑F5-LTM或成熟的开源解决方案LVS；
4）代理层为什么推荐大家使用Haproxy？Haproxy是一个非常优秀的反向代理软件，十分高效、稳定。国内top 10的互联网公司都有在使用；
5）缓存层可以使用Squid或Varnish，个人更倾向Varnish。配置灵活、运行稳定，提供非常便利的管理接口。为啥在缓存层前面加一层代理？优点非常多，列举如下：
根据应用配置URI路由规则，集中热点来提高后端缓存的命中率；
轻松划分网站频道、版块，更好对应用进步组织、规划；
对URI进行一般性安全过滤，抵御注入攻击；
弹性调配硬件资源，应对突发事件产生大流量；
可回收宝贵的公网IP资源；
6）应用层开源技术方案非常多且成熟，在此不详细描述；
7）数据库层主流开源解决方案Mysql是首选，主从复制（一主对多从）是目前比较靠谱的模式；
8）关于Nosql，应用场景不多说，可参考“给部门做的Mongodb技术交流PPT”文章，redis、memcached等作为热点数据存储、数据库缓存都非常理想；
9）内网DNS扮演的角色非常重要，一定要消灭code中出现的内网IP地址，很大程度减少因IP变更、服务器故障而修改源码的情况，同时也便于维护；
10）内网LB适用在内部WEB接口、多台数据库Slave、多台Nosql Slave、公共服务等应用的负载均衡，可以使用LVS、Haproxy来实现，可用性要求不高的应用可行直接使用Localhost DNS轮询；
11）hadoop适合海量数据的存储与处理，如做网站日志分析、用户数据挖掘等；
12）管理集群，平台的核心，运维的阵地；

温馨提示：答案为网友推荐，仅供参考

当前网址：http://33.wendadaohang.com/zd/hB0WB4hB5.html

其他回答

第1个回答 2012-10-15

hadoop适合离线分析，不适合实时性要求高的系统。
高并发的话，基本就是做好负载均衡，服务器可采用nginx，再用内存数据库对热点做缓存，比如memcached。楼主可以在网上多找找架构设计相关的资料。
另外，楼上所说的“hadoop适合处理分布式集群系统，本身是支持高速并发海量数据的写入和读取的”，个人不同意后半句，仅供参考。

第2个回答 2012-10-14

得你自己去试要用的组件，有的人得到的数据是不适合，有的人可以，有的则是方法不全面。

得自己拿到测试试验数据。

相似回答

如何处理大量数据并发操作答：4.批量读取和延迟修改: 高并发情况可以将多个查询请求合并到一个。高并发且频繁修改的可以暂存缓存中。5.读写分离: 数据库服务器配置多个，配置主从数据库。写用主数据库，读用从数据库。6.分布式数据库: 将不同的表存放到不同的数据库中，然后再放到不同的服务器中。7.NoSql和Hadoop: NoSql，n...

JAVA中高访问量高并发的问题怎么解决?答：你指的高并发量大概有多少？几点需要注意：尽量使用缓存，包括用户缓存，信息缓存等，多花点内存来做缓存，可以大量减少与数据库的交互，提高性能。用jprofiler等工具找出性能瓶颈，减少额外的开销。优化数据库查询语句，减少直接使用hibernate等工具的直接生成语句（仅耗时较长的查询做优化）。优化数据库结构...

spark和hadoop哪个好答：Spark整个生态体系正逐渐完善中，GraphX 、 SparkSQL、 SparkStreaming 、 MLlib，等到Spark有了自己的数据仓库后，那就完全能与Hadoop生态体系相媲美。 Spark框架采用函数式编程语言Scala，Scala语言的面向对象、函数式、高并发模型等特点，使得Spark拥有了更高的灵活性及性能。如果你学过java，可能会对scal...

大家正在搜

websocket解决高并发 hadoop结合javaweb web高并发解决方案 hadoop web开发 hadoopwebapi hadoop的web页面禁用hadoop的web 基于hadoop的web日志 hadoop web项目实战