`
沈晓峰
  • 浏览: 26235 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

转载:写给WEB2.0团队,做SNS的公司

阅读更多
当抄袭变成习惯,我想说的是,模仿,站长,你准备好了吗?
  如果你打算做垃圾站,或者赚点广告费的网站,请不要点击这篇文章,我从技术角度方面谈谈WEB2.0网站的模仿问题。
  当投资和流量都不是问题的时候,我想说的是,您真的一帆风顺吗?
  拿SNS网站来说,当匆匆上线的2.0,当一笔笔投资砸进去的时候,当流量上去的时候,您的困惑在什么地方?
  我做过多个2.0公司的技术顾问,简单的谈谈2.0公司遇到的问题(涉及隐私,我用A B C D代替),这里就不再赘述大家众所周知的页面静态化,缓存和代码安全等问题了,有点技术的2.0公司的CTO都知道这些东西,我们谈点发展之后的问题
 
A公司:
 
  A公司做的是SNS网站,程序是两个毛头小伙子做的,目标直指51,程序开发是一帆风顺,功能也比51牛多了,推广也是一帆风顺(A公司有自己独到的推广方式。但是当ALEXA到2W的时候问题出来了,每天下午4点左右,网站速度慢的惊人,基本上打不开,公司三台服务器CPU100%,让人郁闷的是公司的网络配置方式,居然是双WEB的集群,而单独一台DB数据库。整个瓶颈在数据库,于是我建议做DB的集群,分析了一下数据结构,MD,典型的WEB程序员的作品,没有一点数据库设计规范,功能实现是可以,如果要扩展,不可能,集群基本上是不可能的,怎么办?不能办,于是,一个月的时间修改程序,数据结构基本上换了一遍 前期砸进去的几十万打了水飘,用户走光了。
 
  结论:WEB2.0前期设计的时候不应该只考虑功能,应该认真考虑一下底层和数据结构了。
 
B公司:
 
  B公司也是做的SNS网站,程序是3个人开发的,CEO是某名牌大学的经济学硕士,有点知己网的味道,又有一些特色出来,说实话,公司的潜力不错,CEO 有很强的运作能力,感觉前景不错。系统架构还行,但是---但是系统崩溃了,why?系统没有考虑到用户有个海量的说法,文件也有个海量的说法,用户的相册,图片全部存贮在WEB服务器的一个分区上,每个用户一个目录,而打开性能监视器,磁盘的IO高的惊人,基本上无暇响应。众所周知,文件系统也是一个数据库,单独大文件无所谓,关键是整个是300多个G的零碎文件,大量的读写操作,系统崩溃,数据丢失,文件系统的一个链断了,用户数据全部丢失!!!这是一个非常沉重的问题,系统整整停了一个月来做数据恢复(单独文件很容易,但是海量文件目前还没有一个软件能组织起来软件架构)。解决方案:修改程序架构,做分布式文件存贮(程序修改用了8天,但是文件转移却又用去了将近一个月),20万用户损失殆尽
 
  结论:WEB2.0前期的设计应该有应付海量存贮的考虑,整个涉及了程序架构的修改,前期规划不好的话基本上思路一条。
 
C公司:
 
  C公司是一个值得尊敬的公司,CEO技术出身,和比尔盖茨一样,大学未毕业出来做网络,01到03年做短信狠赚了一笔,后来做的小项目也小有所成,说实话,我很佩服。公司做的是校友方面,但是更偏重myspace风格,注重个人主页,推广方面也下了大手笔。系统崩溃的原因其实很简单,由于采用的是微软的 SqlServer,而微软直接就告诉了我们,SQLSERVER不支持集群,他们的数据库超负载,100%就没有下去过,只能横向增加配置,采用了4路 4核CPU系统,但是系统还是崩溃了... 高互动注定了高负载。解决方案:现从基本入手,解决掉几个程序耗能大户,对数据库采用横向切割,将用户每10万进行分组,同时对数据库系统进行散列,将多个表垂直分割,同时进行文件分组,解决问题. 因为修改了数据结构,程序也基本上大动了一下。好在系统没有出大错,损失不算很大,不过对用户体验造成了很坏的影响。
 
  结论:WEB2.0前期设计应该有良好的散列考虑,程序应该能有配合的扩充性,符合数据库的扩充
 
D公司:
 
  D公司是一个各个方面做的比较好的公司,做了CDN加速,图片也独立分出了N个服务器,数据库不错的一个,(CTO是个数据库专家),系统崩溃的原因在于 WEB,按道理说WEB很容易做集群的,但是发现集群并解决不掉问题,他们的集群只允许做4台的WEB集群,但是4台都当掉了。仔细分析,找到原因,我估计整个也是大部分CTO最容易犯的一个错误,或者说他们根本就想不到的问题,就是WEB上传的问题,上传的时候由于时间的原因,线程是保持链接的,300 个线程就可以把一个WEB Server当掉了。解决方案:这个最简单,把上传和其他耗能大户分离出独立出来。程序改动不是很大,但是之前半个月速度满对用户体验的损失也不可小视。
 
  结论:没有什么结论了,毕竟有海量访问经验的CTO不多,也就是那几个大站的。
 
  总结:不是泼冷水,模仿其实是很容易的,随便找几个WEB程序员就能做到,并且很简单,速度可能还很高效,因为WEB2.0无非就是跟数据库打交道,会操作数据库就会做。但是真正做大并不容易,因为能应付海量访问的程序并不简单,现在的程序员都太自命不凡,其实真正有经验的并不多,不要相信一个月薪 5K- -10K的程序员能给你多大的惊喜,能应付海量访问的程序员不是那个价格。
 
 
  如果您想做2.0,想做大,有几个个建议:
 
  一、找DBMS的专家设计好数据库,大部分程序员都不知道分区视图,数据散列,数据组的概念
 
  二、设计好程序架构(这个其实不难,有个高人指导就行了),保持良好的扩展性,成本考虑可以找兼职的系统架构设计师做好系统架构,确定将来的发展瓶颈。
 
  三、考虑好文件存贮的问题。文件存贮的技术含量看起来很低,其实是很高的,可以考虑反向代理的方案。文件存贮出问题了,站点基本上就完蛋了,不仅仅是RAID的问题和存贮服务器的问题,不过道理倒是一点就破的
 
  四、中国国情考虑,这个最致命,需要考虑电信和网通的问题,CDN并不能解决所有问题。互动性的东西并CDN并不是很有效。最关键的是,现有的双线机房遇到DDOS攻击基本上都会当掉,原因很简单,双线机房都是私人机房,本身就不会有太高的带宽,随便攻击一下就可以D掉(顺带提一个笑话,我知道一个双线机房的老总总共1G的带宽却买了4G的金盾墙,很简单800M的攻击就可以搞定)。
 
  五、网络延迟的问题,这是分布式系统必须要考虑的,程序要能容忍0到100秒的数据延迟的功能,也就是同步的问题。不要小看这几十秒,问题很大的,如果你的站点有交互式功能,比如即时聊天,你可以想象一下是个什么结果。对于即时聊天的东西,可以用反向代理来解决(成本较高)。但是对于留言和评论的影响不大,但是如果系统为了健壮做了缓存和静态化的时候,这个东西可能就是灾难性的了。
 
  六、分散你的程序,如果你没有太多的资金构筑动辄百万的服务器,建议把功能分散开来,比如相册一台服务器,留言一台服务器
 
  七、看好你的程序员,如果没有很好的激励措施的话你的程序员很容易写出敷衍性的代码,而这个可能就是将来的大患,程序架构定下来后要修改可能就要费牛劲了。最好你的CTO能对你100%的衷心,100%的负责。
 
  八、文件同步的问题,这个问题可能你觉得没有必要,如果你看一下网通和电信的TTL就明白了,同步要支持续传,并且不能是持续的,否则你的成本会高出N倍,不要期望能通过你的软件实现,交给你的程序员吧,把上面的话告诉他他就知道怎么做了。
 
  九、最狠的一个问题了,也是吃亏最大的问题,不管您跟网警的关系多好,看好你的用户,审核好你的东西,一被停机可能就致命,本人就吃过N次亏。
 
  十、最后,祝各位站长一番风顺,大展宏图。
分享到:
评论

相关推荐

    基于web2.0技术的sns现状及发展趋势研究

    基于web2.0技术的sns现状及发展趋势研究-林颖

    基于web2.0的社交网站

    基于web2.0的社交网站 仿人人网,ssh框架,j2ee

    android_sns2.0:android应用sns2.0源代码-Android application source code

    sns2.0 我的第二个android sns应用程序。 与相比,此应用程序是升级版本。 잭트는 진화된잭트NS NS케케케케케NS NS NS。 。른른。구현했습니구현했습니구현했습니구현했습니。 목차 기술스택 언어: Java,PHP...

    Web2.0社区平台源码

    SpaceBuilder是一款基于asp.net业内领先的Web2.0社区平台。结合博客、相册、文件、迷你博客、论坛、活动、圈子、资讯等应用模块,可以快速的搭建具有SNS特征的在线社区。借助SpaceBuilder平台的服务(用户、朋友、私...

    通俗介绍WEB2.0,W3C,CSS+DIV

    Web2.0是互联网的概念,是相对Web1.0的新一类互联网应用的统称。Web1.0的主要特点在于用户通过浏览器获取...Web2.0技术主要包括:博客(BLOG)、RSS、百科全书(Wiki)、网摘 、社会网络(SNS)、P2P、即时信息(IM)。

    一款新型的WEB2.0社区门户产品 系统包含个人空间 博客 网摘 文件 相册、圈子、活动、消息中心、SNS等功能,可以根据客户需求任意组合、无缝集成

    一款新型的WEB2.0社区门户产品 系统包含个人空间 博客 网摘 文件 相册、圈子、活动、消息中心、SNS等功能,可以根据客户需求任意组合、无缝集成

    一款基于asp.net技术业内领先的Web2.0社区平台

    一款基于asp.net技术业内领先的Web2.0社区平台。结合默认提供的博客、相册、文件、网摘、迷你博客、资讯、论坛、活动、圈子等应用模块,您可以快速的搭建SNS互动社区。借助SpaceBuilder平台的服务(用户、朋友、私信...

    Web2.0站点构建技术初探

    一、 web2.0网站常用可用性功能模块分析 二、 Flickr的幕后故事 三、 YouTube 的架构扩展 四、 mixi.jp:使用开源软件搭建的可扩展SNS网站 五、 Technorati的后台数据库架构 六、 通过了解MySpace的六次重构...

    WEB 2.0简介

    Web2.0是以Blog(博客)、TAG(标签)、SNS(社会网络)、RSS(新闻订阅)、wiki(百科全书)等社会软件的应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式。

    一款基于asp.net技术业内领先的Web2.0社区平台。

    一款基于asp.net技术业内领先的Web2.0社区平台。结合默认提供的博客、相册、文件、网摘、迷你博客、资讯、论坛、活动、圈子等应用模块,您可以快速的搭建SNS互动社区。借助SpaceBuilder平台的服务(用户、朋友、私信...

    SNS现状分析:第三方组件或成SNS新契机.docx

    SNS现状分析:第三方组件或成SNS新契机.docx

    NoSQL非关系型的数据库

     随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如:  1、High performance – 对数据库...

    黑马Redis教程.zip

    而传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如; 随着互联网Web2.0网站的兴起,非关系型的数据库现在成了一个极其热门...

    开源SNS(社会性网络服务)软件iweb SNS v0.7源码

    借助iwebSI平台,站点可以轻松获得支持热插拔及快速增加新节点的集群计算与处理能力(分布式计算与存储/高可用性/负载均衡),以方便管理web2.0类站点持续增长的数据量。SI的web层、db层负载均衡,基于内存的分布式...

    ThinkGrouponV2.0免费团购网代码

    软件版本:V2.0 官方网址:http://www.thinkgroupon.com --------------------------------------------------------------------- 软件介绍: 本软件采用国内流行WEB技术,PHP+MYSQL实现。 thinkgroupon目前是国内唯一...

    人人都玩开心网:Ext+JS+Android+SSH整合开发Web与移动SNS

    人人都玩开心网:Ext+JS+Android+SSH整合开发Web与移动SNS

    黑马redis教程

    SNS类型的web2.0纯动态网站己经显得力不从心,暴露了很多难以克服的问题,例如: · 1、High performance.对数据库高并发读写的需求 web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上...

    iweb SNS社交网络平台软件

    借助iwebSI平台,站点可以轻松获得支持热插拔及快速增加新节点的集群计算与处理能力(分布式计算与存储/高可用性/负载均衡),以方便管理web2.0类站点持续增长的数据量。SI的web层、db层负载均衡,基于内存的分布式...

    Python库 | mypy-boto3-sns-1.12.2.0.tar.gz

    资源分类:Python库所属语言:Python资源全名:mypy-boto3-sns-1.12.2.0.tar.gz资源来源:官方安装方法:https://lanzao.blog.csdn.net/article/details/101784059

    WEB 2.0 社会化引擎(Social Engine) v3.11 全功能插件版.rar

    又一个SNS源码 包括了日志、相册、群组插件。 前台已经完全汉化,请查看预览图片。 Social.Engine.v2.7.0 多模块 2008.03.25日出品 全新安装 升级安装 模块内含有VBB3.70 beat6 keygen[论坛模块]

Global site tag (gtag.js) - Google Analytics