• 数字
    • MySpace月访问量400亿
    • 比喻:粉刷金门大桥,工作完成之时,就是重新来过之日
    • 新闻集团2005年5.8亿收购MySpace,现在至少值60亿
  • 数据缓存
    • 同步问题?
  • 50万账户
    • 数据库采用主从结构,主负责update,从负责read
  • 1-2百万账户
    • I/O并发容量问题
    • 不同的数据库服务器服务于不同的服务
      • 博客
      • 认证
      • 个性信息拆分
    • 新功能使用新数据库
    • 从存储设备与数据库服务器直接交换切换到SAN(Storage Area Network)
    • 用高带宽、专门设计的网络将大量磁盘存储设备连接在一起(SAN)
  • 3百万账户
    • 高度独立,有些信息必须共享
      • 每个数据库必须有各自的用户表副本
    • 向上和向外扩展的问题
      • 向上:多CPU,大内存
        • 昂贵
      • 只要增长趋势存在,无论如何都要走向外扩展的道路
    • 将整个站点作为一个应用看待
    • 将用户按百万一组分割
      • 各组的全部数据存放到一个DB实例
      • 每台两个DB实例,容纳200万用户
    • 还有一个特殊的数据库保存用户名和密码
      • 登录、认证
      • 功能单一
  • 9百万到1千7百万账户
    • 1千万:存储瓶颈、I/O极限
    • 某些数据量会非常大(热门、突发)
    • 3PAR:均匀数据访问负荷(负载均衡)
    • 数据缓存层
      • 被频繁请求的数据对象的副本
      • 不是所有的数据都要放到数据库
  • 2千6百万账户
    • 升级到64位
      • DB:32G内存
      • 升级:64G
  • 可靠性
    • 备用的系统
    • 物理隔开
  • 名言:我们犯过大量的错误,但到头来,我们作对的还是比做错的多