“初雪”與“向量化”| StarRocks Hacker Meetup小記

StarRocks Hacker Meetup是StarRocks社區(qū)組織的面向開發(fā)者的線下活動,旨在通過面對面的交流幫助開發(fā)者深入了解StarRocks核心功能的實現(xiàn)原理,和開發(fā)者共同探討數(shù)據(jù)庫領域的前沿技術。第一季Hacker Meetup共4

StarRocks Hacker Meetup是StarRocks社區(qū)組織的面向開發(fā)者的線下活動,旨在通過面對面的交流幫助開發(fā)者深入了解StarRocks核心功能的實現(xiàn)原理,和開發(fā)者共同探討數(shù)據(jù)庫領域的前沿技術。

第一季Hacker Meetup共4期,將持續(xù)2個月,每兩周探討一個StarRocks的核心功能。歡迎大家持續(xù)關注。第二期Hacker Meetup將在11月20日與大家見面!

上周六,北京迎來了2021年的初雪。StarRocks社區(qū)也迎來了第一期Hacker Meetup:向量化編程的精髓。盡管雨雪交加,但開發(fā)者們熱情不減,現(xiàn)場座無虛席。小伙伴們對這次的活動都感覺收獲滿滿:

“初雪”與“向量化”| StarRocks Hacker Meetup小記

干貨回顧

在本次Meeup上,康凱森同學深入淺出的從幾個方面向大家介紹了數(shù)據(jù)庫向量化編程的要點:

·How to build a fast database

如何構建一個性能卓越的數(shù)據(jù)庫?凱森分別從預處理VS現(xiàn)場處理、架構、數(shù)據(jù)流、系統(tǒng)資源4個角度進行了回答。

·The basics of CPU vectorization

凱森用Top-down的性能分析方法介紹了影響CPU性能的關鍵點,然后介紹了CPU向量化的基本概念和6種向量化編程的方式。

·The key points of database vectorization

數(shù)據(jù)庫的向量化不僅僅是CPU指令的向量化,而是一個巨大的性能優(yōu)化工程。凱森首先介紹了數(shù)據(jù)庫向量化的關鍵點:數(shù)據(jù)組織方式、算子和表達式的向量化,SIMD如何加速Filter、Agg和Join,然后通過具體實例介紹了數(shù)據(jù)庫單核CPU性能優(yōu)化的幾個關鍵點:數(shù)據(jù)結構和算法、自適應策略、SIMD優(yōu)化、內存管理優(yōu)化、C++Low Level優(yōu)化和CPU Cache優(yōu)化等,最后推薦了一些好用的性能優(yōu)化工具。

·Thinking of StarRocks vectorization

凱森介紹了StarRocks向量化工程的一些思考和總結。

“初雪”與“向量化”| StarRocks Hacker Meetup小記

即使頂著風雪也要相見的開發(fā)者們,期待下次相聚!

下期預告

數(shù)據(jù)驅動的前提是能夠快速、準確地獲取和分析數(shù)據(jù)。為了滿足業(yè)務日益增長的實時更新需求,StarRocks重新設計并開發(fā)了存儲引擎,在保持查詢性能不受影響的前提下支持實時更新,并在單表簡單查詢下獲得了10倍以上的性能提升。

下一期,將由StarRocks核心研發(fā)、Apache Kudu PMC常冰琳帶來【列式存儲中實時更新與查詢性能如何兼得】。本次Meetup,冰琳會詳細解讀StarRocks 2.0版本中最新發(fā)布的實時更新引擎,一起來一探究竟吧!

“初雪”與“向量化”| StarRocks Hacker Meetup小記

時間:2021年11月20日14:00-17:00

地點:拓荒族三層(中關村創(chuàng)業(yè)大街10號樓)

演講嘉賓:常冰琳(StarRocks核心研發(fā),Apache Kudu PMC)

*受疫情影響的原因,本次Meetup入場券有限,先到先得。社區(qū)將會審核您的報名信息,StarRocks項目的Contributor擁有優(yōu)先通過權,請以報名成功的短信通知為準。

這個冬天,讓StarRocks陪你盡數(shù)領略技術之美!

原創(chuàng)文章,作者:蘋果派,如若轉載,請注明出處:http://2079x.cn/article/541272.html

蘋果派的頭像蘋果派管理團隊