【全球云觀察 | 科技熱點關注】
“雖然業務已經布局全球的企業仍以大企業為主,但是63%的中小企業已開始計劃出海。”這是亞馬遜云科技《中國企業出海現狀和意愿》的調研數據。
然而,所有出海的大企業、中小企業走向全球化,如何實現更快速,更有韌性,更靈活的發展之路,這是擺在大家面前的重要課題。
在現實中,外部環境變得越來越復雜,許多企業都渴望成功出海并走得更遠,那么,這就需要企業找到開展業務全球化運營的關鍵鑰匙。
說來也巧,前不久,專業分析機構沙利文聯合PingCAP發布了一份《中國企業全球化運營白皮書》,為大家找到了關鍵鑰匙。一致認為:AI、數據技術、云計算三大技術是出海企業提升數智化進而實現全球化運營的關鍵支撐。
全球云觀察分析指出,當數據業已成為企業的資產,企業要出海,數據必先行。有了數據價值的洞察,才能走出去開疆擴土并實現再創新;沒有洞察數據價值的能力,出海可謂寸步難行。因此,對于當前的出海企業而言,數據驅動成為了新的商業發展趨勢。
「數據驅動創新」,一場大變革才剛剛開始
數據驅動成為新商業規則,并非是一個偶然。
你也想出海,我也想出海,企業要出海,數據成了引擎。但出海企業面臨與數據相關的痛點,你是否都了解?
對此,PingCAP首席解決方案架構師房曉樂分析指出,傳統開發范式開始巨變,業務開發范式越來越由數據驅動,開發創新邏輯也隨著改變。以前的舊邏輯是從業務需求到應用場景再到數據支撐,這是一個線性思維。現在面臨出海的新現實,從數據洞察到場景創新再到業務重構,形成一個閉環的驅動體系。
比如一個電商出海企業,通過用戶行為數據的洞察與分析,反推產品創新,然后再將創新后的產品推向海外市場,成功之處在于數據驅動對業務開發范式的創新價值越來越高。倘若這樣的電商企業出海繼續按照從業務需求到應用場景再到數據支撐的舊邏輯行事,不僅很難找到更適合自己發展的海外業務機會,同時也難以快速找到產品創新的新機遇。即便有可能根據海外用戶需求找到自己的市場機會,但如何快速構建創新應用場景,并實現快速的數據支撐,更關鍵的是沒有數據支撐如何構建新產品。
既然業務開發范式越來越由數據驅動,那么數據架構就至關重要,但是令人心痛的是數據架構選型的慣性思維帶來了隱性成本問題,比如說,大家知道 MySQL 在互聯網時代被廣泛使用,尤其在中國有很好的生態和從業者,但今天很多數據密集型的場景,MySQL 并不是最佳選擇,反而 MySQL 過度使用會帶來“三高”問題,集群規模增長高、數據副本無序擴大高,數據技術棧治理復雜度高,而這“三高”是影響很多企業實現范式變革成敗的根本原因。
需要明確的是,在企業組織中,不同部門或系統之間存在數據不一致、難以共享或冗余的問題。由于技術架構、數據存儲和接口集成等問題,導致不同信息系統、業務部門或數據存儲之間相互隔離,數據無法順暢流通、共享和整合,形成數據孤島化,導致機會成本可能相當高昂,并影響企業的效率、決策、擴展、客戶體驗等各個方面。比如零售出海企業,線上線下數據的流通、共享與融合,對其業務拓展意義重大。否則,零售企業出海舉步維艱。
企業出海走向全球化,不僅要首先考量這些痛點,而且也需要重視基于數據的開發范式的變革,擁抱數據架構的發展趨勢。
回顧過去的十多年,展望未來五年,數據架構演進的三次革命你是否都清楚?總結起來就是,原生分布式、云原生、AI原生。
數據架構變革的分布式覺醒發生在2010年前后,原生分布式架構(Distributed-Native Architecture)帶來彈性基因,讓在線擴縮容變得容易,實現多活容災也成為現實,分布式架構有效的解決了數據大容量與數據訪問高吞吐量的問題,在這個基礎上,數據技術還是加速進行“三大融合”,包括 HTAP(TP與AP融合),多模(結構化數據與半結構化數據融合)、數據融合(多租戶、多業務模塊的融合),“三大融合”才是解決“三高”的關鍵路徑,能從根本避免數據集群規模過大、數據副本無序擴展、數據技術棧過多的問題。
到了2015年前后,云化浪潮洶涌而來,云原生(Cloud-Native)帶來敏捷進化論,存算分離架構成為了業界熱點,秒級彈性不再是挑戰,充分利用Kubernetes(K8s)的原生特性,構建彈性、可擴展、高可用和易于管理的應用系統成為行業發展大趨勢。
數據技術在云平臺上,繼續進化,基于三大發現進行了結構性提升。
一是,更加極致的彈性。業界稱之為 Database Serverless,可以根據業務需求,隨時啟動集群、擴容集群、關閉節點等。
二是,成本結構性下降。云上對象存儲(比如 AWS S3)已經是存儲的新的事實標準,新一代數據庫可以將更多的數據, 比如冷數據放置在對象存儲上,進而實現結果性的成倍下降。
三是,資源使用效率提升。數據庫尤其是關系型數據庫,有很多約束(Database constraints),維護這些約束需要大量額外資源和后臺任務(比如 DDL、LSM Compaction 等)。在云時代,這些后臺任務可以盡量剝離出來,比如,我們可以通過在 S3 上獨立進行LSM Compaction,最終大大提升常用數據資源的使用效率。
從原生分布式到云原生,數據架構變革從中得以創新,然而到了2020年智能化涌現時,AI原生(AI-Native)的到來,以前所未有的力量,驅動著數據架構范式的躍遷,從人工規則升級到模型驅動。從而,數據庫技術找到新的三大發展方向。
方向一,通用數據庫將接入向量引擎、圖數據庫引擎、全文檢索等。
方向二,數據庫的計算能力將成為核心競爭力包括優化器增加加算子能力豐富,優化器能識別更多存儲引擎并更加智能。
方向三,SQL仍然具有強大生命力,同時SQL將與機器學習融合,逐步實現用 SQL完成AI任務。
由此而言,從數據庫選型不合理(比如 MySQL過度使用)帶來的“三高”影響,成為企業實現范式變革成敗的根本原因。到數據技術加速進行“三大融合”,致力于解決“三高”問題。然后在云平臺上,數據技術繼續進化,基于三大發現進行了結構性提升。如今,AI原生(AI-Native)驅動著數據架構范式的躍遷,數據庫技術終于找到了新的三大發展方向。數據架構三次革命性的演進過程,就是數據庫技術每一次創新的精彩展示。
房曉樂再次指出,TiDB 以原生分布式的開源數據庫為起點,現在已經完成原生分布式×云原生的進化,正在進入原生分布式×云原生×AI就緒的階段。
TiDB起初以分布式奠基,采用分布式內核,實現實時HTAP,同時通過云化重構支持云原生,開放多云就緒,在多個公有云上呈現一致性的用戶體驗,進而支持用戶的Serverless化。Serverless部署模式讓出海企業能夠根據需求靈活組合模塊化、API化、即插即用的服務,無需擔心底層技術的管理與維護,從而專注于業務開發,顯著提高效率和資源利用率,同時降低資源開銷,提高投入產出比,讓成本投入聚焦于出海及全球化發展的業務價值。
隨著AI融合,采用AI增強的智能引擎,支持千億級非結構化數據的向量化檢索,時序預測自動擴容,提升資源利用率。還有內置自適應智能選擇索引功能,有利于用戶提高查詢效率、優化決策過程。從而,TiDB為出海企業帶來了商業價值轉化的創新路徑,通過實現數據實時性,提升決策敏捷度,構建市場響應速度的正向循環。加上采用金融級數據強一致保障方案,為出海企業提供更優的風險防控體系,實現數據安全出海。
事實上,數據驅動創新并不能一蹴而就,數據架構演進歷經原生分布式、云原生、AI原生的三次進化,這是一個整體的系統工程。隨著開發范式、數據架構思維與趨勢都出現新變革,AI正在重構眾多行業,這場變革已經拉開帷幕。
「出海企業到底想要500輛小轎車」,還是10輛大巴車?
既然數據驅動創新成為了全球科技行業的大變革與大趨勢,那么出海企業如何駕馭自己的發展,遴選數據庫是要500輛小轎車還是10輛大巴車更合適?
既然要選擇,那么先明確一下小轎車與大巴車的區別可好。初步一看就是一個小、一個大而已,然而,進一步分析具體載客量大小、設計用途和出行服務效率,兩者卻有著很大的不一樣。
在載客量大小上有著大不同:小轎車的載客量有限,車身尺寸設計較小,一般為5到7個座位,倘若車主想讓更多的親戚朋友同車同行,小轎車實難滿足不同數量的乘客出行需求,只是適合人數較少的三三兩兩家庭成員出行。
大巴車的載客量較大,車身尺寸也設計較大,一般在20座以上,也有30-60座,既可以滿足少量乘客出行需要,也可以一次性滿足大量乘客出行需求。
對于出海企業來說,首要考慮車載客量能否可大可小,才不至于因為人多人少而不停換車。這好比數據庫的架構彈性,彈性是基礎設施核心問題,這是業務敏態開發范式具化要求之一,關乎出海企業現在聯結未來發展的成敗。以業務增長的發展眼光來看出海,雖然當下發展對每個企業都很重要,但是擁有未來眼光的企業才能在紛繁復雜的出海業務上獲得長足發展。
在設計用途上有著很大不同:小轎車設計為個人或家庭日常出行需要,很難融合不同家庭類型的乘客,更不要說是不同出行目的的乘客,不同居住位置片區的乘客,不同旅途需求的乘客。小轎車偏個性化的單一用途明顯,很難融合更多乘客的用途需求。
大巴車可以融合不同出行目的的乘客,不同家庭類型的乘客,不同居住位置片區的乘客,不同旅途需求的乘客。大巴車內所有設施、公共資源滿足車內乘客的共享使用。從設計之初,大巴車就融合了不同乘客的用途需求。
對于出海企業而言,不僅需要架構彈性支持業務的敏捷發展,而且需要一個融合不同乘客用途需求的大巴車那樣,具備更強的數據融合能力,將業務數據融合在一起,以此支撐業務創新的敏捷。
針對多業務模塊的數據融合,通過將不同業務模塊的數據整合到一個統一的視圖或數據庫中,以便進行深入分析,以及實現跨業務的數據洞察。作為一種分布式NewSQL數據庫,TiDB可以作為一個強大的平臺來存儲和查詢不同業務模塊的數據,如商品數據、訂單數據等。
針對不同數據類型的融合,涉及到不同數據類型之間的轉換,兼容不同的數據類型。TiDB的多模設計支持多種數據類型,包括數值、字符串、日期時間、JSON等類型,可以按照不同的應用需求選擇合適的數據模型。對于需要復雜查詢的應用,繼續使用標準的SQL模式。對于需要高性能鍵值操作的場景,可以利用TiKV的鍵值API。對于時間序列數據的應用處理,可以借助時序數據庫特性給予良好支持。對于需要存儲復雜文檔的應用,可以使用JSON數據類型。出海企業可以通過TiDB實現多模一體的數據架構,利用其強大的功能和靈活性來滿足多樣化的業務需求。
針對不同數據分片的融合,TiDB實現了冷溫熱數,因有興趣試用TiDB Cloud的業內朋友可以點開文章末尾的閱讀原文。為數據庫的訪問頻度、SLA等級隨數據熱度的降低而降低,按照熱、溫、冷水平拆分三類集群,在分片規則上引入了相對時間、絕對時間的概念。只有熱、溫集群間涉及數據ETL作業,保證熱集群的容量相對穩定,溫集群預留足夠空間,滿足業務創新的敏捷擴展。
針對多租戶的融合,獨立數據庫是一個租戶獨享一個數據庫實例,租戶的數據彼此物理不可見,租戶間更難實現數據共享。出海企業往往有不少從事SaaS業務,由于SaaS同時支持多個租戶,每個租戶又有很多用戶,這對支撐軟件的數據庫平臺的性能、穩定性和擴展性提出很大挑戰,需要平衡數據的共享、安全隔離和性能的關系,達成多租戶的數據融合。
現在看來,PingCAP的TiDB就是一輛數據庫領域的大巴車。作為一款同時支持在線事務處理(OLTP)與在線分析處理(OLAP)的融合型分布式HTAP數據庫產品,不僅兼容MySQL協議和生態,支持在本地和云上部署,而且TiDB在向量數據庫能力方面也不斷突破。2024年6月,TiDB Cloud Severless率先支持向量搜索特性。目前,TiDB引入了向量數據類型和多個向量函數,支持存儲高達16383維的向量。
作為大模型的外置數據“大腦”,向量數據庫結合AI大語言模型LLM,可以更好實現語料的持久化存儲。為此,TiDB Servelress作為AI就緒(AI-Ready)的新一代數據庫服務,不斷完善AI結合的能力,支持向量搜索,讓MySQL用戶可以直接在TiDB數據庫中方便構建RAG(檢索增強生成,Retrieval-Augmented Generation)相關的AI應用。
在房曉樂看來,作為業務敏捷的第二大關鍵,數據融合也是大勢所趨。在數智化時代,數據來源廣泛且形式多樣,HTAP(混合事務分析處理)、多模一體、向量與關系數據一體、多租戶融合等各種形式的數據融合都避免不了。唯有通過數據融合,企業才能打破數據孤島,將不同類型、不同來源的數據整合在一起,進行綜合分析,從而獲得更全面、深入的洞察。例如,將交易數據與客戶行為數據融合,能為企業精準營銷提供有力支持。這也充分表明,數據架構技術伙伴應擁有先進的數據融合技術與工具,幫助出海企業實現數據的無縫對接與深度融合,釋放數據的最大價值。
數據一籮筐,什么都可往里裝。出海企業通過TiDB數據庫平臺,將業務數據融合在一起,尋求海外的業務創新也就有了新底氣。
或許,在這個時候,不少朋友已經看出來了,大部分出海企業因實際業務發展的敏捷性需要,選大巴車似乎更穩妥,而非多輛小轎車。畢竟大巴車擁有的架構彈性與數據融合能力更為強大,這正好也是實現業務敏捷的兩大關鍵能力。
不過,別急,這還沒比完。在出行過程中所有乘客享受的服務效率不同:小轎車更注重乘客的個人舒適性和個性化審美需求,比如搭配多功能座椅與豪華內飾,但是小轎車空間較小,運輸行李有限。在出行過程中,同行者下車尋求公路服務站設施才能實現喝茶、用餐、洗手、如廁等需求,這需要時間上的等待,無法隨時隨地在車上實現。小轎車的低下服務效率好比開發傳統范式,一切需要在出行途中去實現,出海企業的業務邏輯和計算大部分通過應用開發層來實現,其結果不僅周期長,成本也大。
大巴車對于乘客出行服務考慮更全面,在大巴車內配備行李艙可以實現多件行李同步運輸,高端大巴車還有豪華內飾和功能性設施,滿足旅途中乘客在車上享受移動WIFI、茶水、餐食、洗手間等需求。更有甚者,大巴車還有配置單人床,滿足長途乘客的躺平需要。在大巴車這樣一個平臺上,可以完成數人的出行需要,整個出行效率獲得明顯提高。
采取計算下沉的方式,讓更多的業務邏輯和計算在數據庫或者數據架構中完成,這就好比大巴車一樣,乘客旅途吃喝拉撒睡都可以在車上靈活完成,不需要下車,更不需要等待。如此一來,整個業務的開發效率會大大提升。對于出海企業而言,通過采用計算能力強的數據架構,選擇距離數據更近的地方進行計算,實現計算下沉,應用開發的復雜度將獲得大幅度降低,提升了整個業務架構的敏捷性。
由此來看,為了滿足出海企業的業務敏態發展,架構彈性、數據融合、計算下沉三大能力一個都不能少。架構彈性是首要基礎,而數據融合是核心能力的集中體現,同時對于計算下沉能力的重視,也將成其為未來的核心競爭力。載客量大小好似架構彈性,設計用途好比數據融合,出行服務效率猶如計算下沉。到底選小轎車,還是大巴車,到這個節骨眼兒上,你是否覺得一切都變得豁然開朗了呢?
題外話:假如出海企業已經有了小轎車,突然心血來潮,想要更換大巴士,該如何是好呢?別急,TiDB對MySQL數據庫協議有著很好的兼容,同時還提供數據庫遷移系列工具,保障出海企業數據遷移安全,提供基于整個數據生命周期的解決方案。此外,有興趣免費試用TiDB Cloud的業內朋友可以點開文章末尾的,按照頁面指引進行即可。
「出海風高浪急」,三大要素不可少
即便富有眼光的出海企業,從一開始就選擇了大巴車,然而出海發展業務和在國內地區還是有所不同,受到國際氛圍與全球經濟影響,外部環境畢竟越來越復雜,在風高浪急中如何把船開得更穩當,就顯得非常重要。這在很大程度上,決定了企業出海能否劈波斬浪,揚帆遠航。
為此,房曉樂分析指出,企業出海想要行穩致遠,三大要素不可少,開源與多云、全球服務體系,以及數據合規與安全,每一樣都值得重視起來。
第一要素,不能被技術綁死,必須考慮開源與多云。
在企業出海過程中,企業應優先考慮開源與多云策略。開源數據庫可以為企業降低技術綁定風險,開源技術以其代碼的開放透明性、社區的廣泛協作性和開發的高度可定制性,為企業帶來更多的信任與可靠性。通過開源,企業能夠深入了解技術細節,根據自身應用場景和數據處理需求進行優化,避免因依賴單一商業數據庫技術而出現高昂的許可費用投入,保持技術選擇的靈活性,降低未來技術優化與升級的風險。
PingCAP自成立初就以開源為核心發展理念,所有的商業性選擇都建立在開源之上。產研都是基于開源體系和社區持續發展。由此誕生的TiDB產品不僅能快速地獲取反饋,而且理解并應對全球用戶不同需求,建立起用戶的持續信任。目前,PingCAP已在全球范圍內與大規模的社區用戶與商業用戶形成連接,驅動TiDB在真實場景下持續演進。
同時,多云策略與云中立性有助于出海企業避免單云鎖定(lockin)。不同云服務提供商在功能、性能和價格上各有優勢,采用多云架構,企業能夠根據業務需求靈活選擇最合適的云服務,降低成本,提高業務的穩定性與靈活性。數據架構技術伙伴應具備豐富的開源技術應用經驗和多云架構搭建能力,助力企業在開源與多云的道路上穩步前行。當前,TiDB提供了多云支持,企業可以根據業務需求和合規性要求靈活遷移。
第二要素,全球服務體系尤其重要,本地化技術支持更快速及時有效。
對于出海企業來說,擁有一個具有全球服務體系的合作伙伴至關重要。在主要區域具備本地服務,意味著企業在海外運營時能夠獲得及時、有效的技術支持。通過全球服務體系的支持,有利于降低跨文化協作成本,本地團隊對市場環境和客戶需求的深度理解,可減少溝通誤差,能夠快速響應企業的數據架構需求,解決技術難題,提升技術落地的精準性。
值得注意的是,專業的數據架構選型和容量規劃服務能力也不可或缺。數據架構技術伙伴應根據企業的業務特點、發展規劃以及海外市場的實際情況,為企業量身定制最適合的數據架構方案,并精準規劃數據存儲與計算容量,確保企業在數據架構方面的投入既滿足業務需求,又實現資源的最優配置。
基于開源觸達全球大規模用戶的基礎,PingCAP通過不斷完善全球化組織架構與多元生態體系,打造面向全球的商業模式,已經在歐美日發達經濟體和亞太新興市場都獲得客戶和市場認可。
一方面,多元生態有助于理解并適應不同地區的市場需求。如PingCAP通過亞馬遜云科技等全球云廠商的生態協同,快速接入全球區域市場的主流技術棧,加速企業全球化部署。
另一方面,全球組織架構使PingCAP能更好地提供本地化服務。PingCAP在東京、新加坡、阿姆斯特丹、硅谷等海外多地構建了本地化客戶服務體系,能夠為全球化企業提供本地化的技術支持,幫助企業更好地應對出海過程中的技術挑戰。
目前,PingCAP正在持續優化和增強TiDB Cloud的能力,為出海企業低成本敏捷實施全球化戰略提供支持。TiDB Cloud Serverless等新形態的推出,助力出海企業能夠將更多精力投入到核心業務創新上。
第三要素,數據合規與數據安全,已成為全球范圍內企業運營的生命線。
出海企業拓展海外業務,實現數據庫應用的落地,合規安全必須放在第一位。不同國家和地區對于數據保護、隱私政策等有著嚴格且各異的法規要求。如歐洲的GDPR、中國的《數據安全法》,以及ISO質量體系等。數據是出海企業的命根,也是出海企業的資產,很顯然數據安全非常重要,實現備份與容災機制也是拓展出海業務的剛需,以及注重做好數據加密、審計等也十分有必要。
因此,出海企業遴選的數據架構技術伙伴必須具備全球合規和安全保障能力,熟悉各國的數據法規,采取先進的安全技術手段,確保企業數據在存儲、傳輸和使用過程中的安全性與合規性,并能快速響應與合規適配。如PingCAP在東京、新加坡、阿姆斯特丹等關鍵區域部署本地團隊,能夠實時響應企業需求,結合當地數據安全法規,如歐盟GDPR、東南亞數據本地化政策等,優化技術方案。
此外,攜手云廠商共建合規工具鏈,如AWS合規加密工具與PingCAP的TiDB密鑰存儲管理結合,可以更好地自動化滿足各地區數據隱私法規。PingCAP還構建了數據審計工具,便于出海企業快速獲取數據審計資料,節省審計資料提交時間,
據《中國企業全球化運營白皮書》分析,國家發出“一帶一路”倡議,并出臺鼓勵中國科技企業出海的政策,出海已經成為一種新的企業時尚,一些企業出海不足5年就已經獲得快速的業務增長,出海真的可以遇到藍海。可見,在新一輪發展浪潮中,企業出海已成為拓展市場、增強競爭力的重要途徑。想要實現劈波斬浪,不僅要重視開源與多云、全球服務體系、數據合規與安全三大要素,更要將每一項落到實處,方能直掛云帆闖藍海。
「小結」:順勢而為,揚帆遠航
無論是中國企業全球化和海外企業全球化,出海企業遴選數據庫技術伙伴,首先需要明白自己的剛需,順應數據驅動的大變革趨勢,選好屬于自己的大巴車。從開發范式的變革到思維的轉變,從擁抱數據架構發展趨勢到滿足業務敏捷的各項要求,從開源與多云策略到全球服務體系與合規安全保障,做好多重考量與準備,每一個環節都緊密相連,關乎企業出海的成敗。
一旦選擇了合適的、富有前瞻性的、擁有全球眼光的數據庫技術伙伴,企業才能在海外市場發揮出數據驅動的潛力與價值。畢竟出海業務說變就變,不僅要考慮眼前需求,而且還要考慮業務獲得發展后的變化。
因此,風高浪急不要怕,風浪越大魚也大。揚帆遠航,做大做強。對于企業出海遴選數據庫技術伙伴,你還有什么建議,歡迎一起來討論。
你怎么看?
歡迎文末評論補充!
【全球云觀察|全球存儲觀察 |科技明說|阿明觀察】專注科技公司分析,用數據說話,帶你看懂科技。本文和作者回復僅代表個人觀點,不構成任何投資建議。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.