洪士灝: 看看UC Berkeley怎麼做big data... - TopicsExpress



          

洪士灝: 看看UC Berkeley怎麼做big data... 以系統研究(計算機架構、作業系統、資料庫系統)的教授為主體,加上幾位做演算法、理論、Machine Learning研究的教授對各種重要的巨量資料應用做最佳化。 巨量資料應用包括: BLB: Bootstrapping Big Data Cancer Tumor Genomics: Fighting the Big C with the Big D Carat - Collaborative Detection of Energy Bugs CrowdDB - Answering Queries with Crowdsourcing DNA Processing Pipeline DNA Sequence Alignment with SNAP 發展出來用以支持巨量應用的系統研究包括: Akaros - An operating system for many-core architectures and large-scale SMP systems DFC -- Divide-and-Conquer Matrix Factorization MDCC: Multi-Data Center Consistency Mesos - Dynamic Resource Sharing for Clusters MLbase: Distributed Machine Learning Made Easy PIQL - Scale Independent Query Processing Real Life Datacenter Workloads Shark: SQL and Rich Analytics at Scale Spark - Lightning-Fast Cluster Computing Sparrow: Low Latency Scheduling for Interactive Cluster Services 應用很值錢,人家的source code不會給你;另一方面,系統軟體很多都是open source,很大方的提供給識貨的人來用。 現在是application-system co-design的時代,也是打群架的時代。人家組一個團隊來創造擴大價值,我們有些研究團隊還停留在組隊去跟政府要錢分錢的山頭主義。即便能力不足以創新,會善用人家的技術和軟體,也能夠創造很高的價值。 Big data研究的風景很美,比霧濛濛的雲端好多了,躬逢其盛的學術中人,不妨多多走出象牙塔看看。
Posted on: Tue, 15 Oct 2013 08:30:07 +0000

Trending Topics



Recently Viewed Topics




© 2015