Bering Note – formerly 流沙河鎮

情報技術系のこと書きます。

OpenSearchCon North America 2025「中国における活気あるOpenSearchのOSSコミュニティ成長の軌跡」- Charlie Yang, AWS

OpenSearchCon North America 2025のセッション「Growing a Vibrant Open Source OpenSearch Community in China」をまとめます。

www.youtube.com
資料
https://static.sched.com/hosted_files/opensearchconna2025/a7/Growing-a-vibrant-community.pdf

スピーカー


Charlie Yang氏は、Amazon Web ServicesOpenSearch Shanghaiチームでソフトウェア開発マネージャーを務めています。検索技術やAI、データ分析といった分野に興味を持っており、AWSに入社する前は複数のスタートアップで、主に検索・推薦システムやcomputer visionの研究者として働いていました。

中国のOSSを取り巻く状況

今回のセッションでは、通常の技術トピックとは少し異なるテーマとして、中国におけるOpenSearchコミュニティの発展について取り上げます。過去1年間で起きた出来事を振り返りながら、なぜ中国がOpenSearchにとって重要な市場なのかを説明していきます。

なぜ中国なのか

まず「なぜ中国なのか」という問いから始めましょう。


中国がOpenSearchにとって活気ある市場である理由は、大きく3つの要素に集約されます。
第一に、中国には本質的に活気あるIT市場が存在していることです。
第二に、コミュニティ全体を支える人材の密度が高いことです。
そして第三に、強力なパートナーの存在です。
これら3つの要素すべてにおいて、中国は明確に「Yes」と答えられる条件を満たしています。

中国IT市場の規模


まず中国のIT市場の規模について見ていきます。2024年の中国IT市場の総収益は13.73兆元に達し、利益は1.65兆元という非常に大きな数字となっています。絶対値としても極めて高い水準ですが、注目すべきは急速な成長トレンドが続いている点です。
2024年の最初の5ヶ月と2025年の最初の5ヶ月を比較すると、IT市場全体の規模は5.02兆元から5.58兆元へと成長しており、11.2%の成長率を示しています。世界的に経済状況が芳しくない現状において、中国だけでなくグローバルに見ても厳しい環境の中、この成長率は依然として力強いものと言えます。
こうした市場規模と成長性を考えると、中国のIT市場は新しいOpenSearchコミュニティを成長させるのに十分な大きさを持っていると考えています。

人材の層の厚さ


次に、人材について見ていきます。
ウォールストリートの報告によると、ソフトウェア開発における中国の貢献規模は確かに印象的です。中国全体で700万人の開発者が存在しており、この数字は香港の全人口に匹敵する規模となっています。
この巨大な人材基盤のうち、120万人がGitHubに関わっており、彼らはOpenSourceコミュニティへの潜在的な貢献者として期待できます。OpenSourceの新しい成長市場に求められるのは、まさにこうした人材密度であり、中国はその条件を十分に満たしていると言えます。

中国IT企業のOSSへの貢献


第三の要素として、中国には既に多くの有名企業が存在しています。ByteDance、Alibaba、Baidu、JD.com、Tencent、Meituanなど、名だたる企業が並んでおり、これらの企業の人材によって素晴らしいOSSプロジェクトが数多く生み出されています。
代表的なものとして、Vue.jsは今日でも最も有名なフロントエンドフレームワークとして広く知られています。またDifyは、大規模言語モデルエージェントの統合とAIパイプライン作成のための優れたツールとして注目されています。フロントエンド開発者であれば、Ant DesignとElement UIもご存知でしょう。これら2つのリポジトリはフロントエンドとデザインの分野で非常に高い人気を誇り、多くの開発者から信頼されています。ほとんどのWebページは、Ant Designのチャートや、Element UIのボタンやバナーなどを使って構築することができます。
さらにトップ5には、PingCapのTiDBがあります。これはOLTPとOLAP、いわゆるHTAPデータベースで、商用版と分かれてはいますが、コミュニティバージョンも非常に優れており、市場で高い評価を得ています。興味深いことに、中国発のリポジトリでトップ1となっているのは996.ICUで、これは労働時間超過に反対するコミュニティとして、現在GitHubで最も人気のあるリポジトリの一つとなっています。

中国におけるOpenSearchコミュニティ


では、中国のOpenSearchコミュニティは今日どのように成長しているのでしょうか。結論から言えば、非常に良好な状態にあると言えます。今回のOpenSearchConを見ても、AWS社員を除くと中国からの参加者はあまり多くありませんが、これはおそらく渡航費の制約によるものでしょう。しかし実際には、中国のコミュニティは非常にうまく成長しています。

高い注目度


OpenSearchリポジトリが作成された初日から、中国はトップstargazersとなっています。つまり、GitHubで付けられたstarの大部分は中国のIPアドレスから来ているのです。中国の開発者はあまり表立って発言しないかもしれませんが、GitHubのstarという形でOpenSearchへの愛情を表現しているようです。
実際、多くの人が既に中国での日常業務でOpenSearchを活用していますが、私たちがその存在を十分に認識できていないことがあります。これは一つの課題と言えるでしょう。

OpenSearchへのコントリビューション


過去28日間のデータを見ると、OpenSearchコアリポジトリへのActive ContributorsとIssue作成において、中国は常に3位の位置を維持しています。米国やインドと比較すると大きな差がありますが、これはAWSの本社が米国にあり、インドに大きな開発部門が存在することが影響していると考えられます。
過去28日間では、上海チームはマネージドサービスに取り組んでいましたが、3人の貢献者と6人のIssue作成者は上海チーム以外からの参加であり、これは素晴らしい数字と言えます。少なくとも3位という順位を維持できていることは、中国コミュニティの活発さを示していると言えるでしょう。

メンテナの観点から見ると、Amazon以外の組織からは2人のOpenSearchコアメンテナと1人のk-NNメンテナが誕生しています。一方、Amazon Chinaチームは主にプラグインを担当しており、プラグインには多くのメンテナがいますが、OpenSearchコアには1人のみとなっています。
Amazon以外から複数のコアメンテナが出ているというのは素晴らしい記録であり、今年後半から2026年初めにはこの記録をさらに更新できると考えています。

ByteDanceの貢献

私たちはOpenSearchコミュニティの長期的な発展に非常に自信を持っています。それに伴い、2025年3月にByteDanceは正式にOpenSearch Foundationのメンバーとして参加しました。この決定は、検索エンジンとしてのOpenSearchの将来性に対する楽観的な見方だけでなく、オープンなコミュニティこそがイノベーションの強い能力を持つエコシステムを構築するのにより適しているという一貫した信念を反映しています。
-- Jeff, ByteDance Volcano Engine Manager of OpenSearch

なぜこれほど早く成長しているのでしょうか。その理由は、ゴールドパートナーであるByteDanceの存在が大きいと言えます。ByteDanceは多くの面で協力してくれています。
ByteDanceがOpenSearchにこれほど大きな信頼を寄せている理由はいくつかあります。
第一に、彼らはOpenSourceの未来を信じているという点です。OpenSourceがトレンドであり、そのオープンな姿勢を人々が信頼し、より多くの人が利用していくだろうと考えています。
第二に、OpenSearchの基盤についてです。現在Linux Foundationと提携していることで、OpenSearchが永続的にOpenSourceであり、すべてを公開するという姿勢を示しています。彼らはこの信念に基づいて信頼し、貢献したいと考えているのです。
最後に、OpenSearchの技術が輝いているという点です。彼らは競合他社と比較した上で、OpenSearchがより良くなり、最高になるトレンドにあると評価しています。

ByteDanceからは2人のOpenSearchコアメンテナが誕生しています。Pan GuixinとKe Weiの両氏です。上海のOpenSearchチームからはまだ1人しかコアメンテナが出ていないことを考えると、少し恥ずかしい気持ちもあります。
彼らには印象的なスローガンがあります。以前、彼らと夕食を共にした際に聞いた言葉ですが、「私たちはOpenSearchのコアコミュニティに参加してバグを修正しています。なぜなら、多くのバグが置き去りにされていると考えており、私たちは助けるためにここにいるからです」と語っていました。この言葉を聞いて、私は本当に感動しました。多くの人は、メンテナは誇りに思うべきものであり、何らかの権限のようなものだと考えがちです。しかし、彼らは「メンテナであることは、皆のためにバグを修正することだ」と捉えているのです。この姿勢は本当に素晴らしいと思います。

Infinity Labsの貢献


もう一つの重要なパートナーとして、Infinity Labsがあります。Infinity LabsはElasticsearchから派生した企業で、以前からアナライザ、特に中国語の非常に有名なIK Analyzerの貢献者として知られています。
中国語は英語とは異なり、スペースで区切るだけでは適切に処理できません。文から個々の単語を切り出すには、いくつかのルールとモデルが必要となります。彼らはIK Analyzerのメンテナであり、OpenSearchでもIK Analyzerをサポートする時期が来たと考えていました。何度か議論を重ねた結果、彼らはコードをOpenSearchプロジェクトに直接貢献することはしませんでしたが、自社のリポジトリでOpenSourceとして公開しました。この形でもコミュニティへの貢献として十分受け入れられると考えており、実際に彼らのリポジトリは多くのスターを獲得しています。

OpenSearchOSSコミュニティ成長の記録


では、なぜ中国のOpenSearch OSSコミュニティに活気があり、成長しているのでしょうか。それについて考えます。
2つの思い出深いエピソードがあります。

ByteDanceとの出会い


ある日、AWSのビジネスチームからOpenSourceチームのリーダーシップに対して、ByteDanceがコミュニティに非常に興味を持っており参加したいと考えているという連絡がありました。しかし、リーダーシップレベルでの議論は非常にうまく進んでいましたが、実際には詳細な行動規範は策定されませんでした。
その発表の後、正直に言うと不安がありました。彼らは本当に貢献してくれるのだろうか、それともいつか方向転換してコードベースをフォークし、クローズドソースにして独自の道を進むのではないかという懸念です。しかしある日、Jeff氏から電話がありました。彼は現在、親しい友人の一人となっています。彼は「広東省と北京から何人かのエンジニアが上海に集まるので、コーヒーに招待したい。協力について話し合いましょう」と言いました。彼のオフィスは上海チームのオフィスのすぐ近くにあったのです。

その提案に対して、こちらからは別の提案をしました。「皆さんが上海に集まっているのですから、私たちのオフィスに来てワークショップを開催しましょう。全員で、これまで何をしてきたか、これから何をするつもりなのか紹介し合いましょう」と。このワークショップは非常に楽しいものとなり、午後いっぱい、夕方まで続きました。全員がOpenSearchについて何をしているのか、何を考えているのかを説明し合い、とても有意義な時間となりました。
最後に、Jeff氏は「ビジネスの観点から見ると、2社間の協力はまだ洗練が必要ですが、私たちはOpenSourceのリポジトリに貢献する意思があります」と伝えてくれました。これは素晴らしいニュースでした。会議が終わった後、「もしコードの補足やコードレビューなどで何か助けが必要なら、いつでも言ってください。カナダチームにも連絡してサポートします」と伝えました。
そして1ヶ月後、彼らの最初のPull Requestが承認され、マージされました。これは非常に大きな機能で、HNSWのための新しいアルゴリズムという素晴らしい機能でした。そして、k-NNリポジトリへのByteDanceからの最初のコミッターであるYin Chung氏がメンテナに昇進しました。
このストーリーは非常にハッピーな結末を迎えたのです。

更なるコミュニティ拡大に向けたイベント開催


ByteDanceとの協力が成功した数ヶ月後、さらに多くの友人を作ろうという考えが生まれました。ByteDanceが良い例を示してくれたことに触発され、コミュニティをさらに広げていくことにしたのです。既にVector DBやGenAIなどのWeChatチャンネルを構築していたため、これらのチャンネルを活用してミートアップを開催することにしました。様々な企業のエンジニアに来てもらい、OpenSearchがどんなものかを聞いてもらい、お互いに話し合ったり、少なくとも私たちと会話したりする機会を作ろうと考えました。
上海の別のSDMと、このイベントをどこで開催すべきかについて話し合いました。そして、オフィスの近くに、とても素敵なコーヒーショップのある近所のセンターがあることに気づきました。この場所では週末に多くのイベントが開催されており、イベントスペースとして最適でした。多くの人が参加し、無料のコーヒーを飲みながら交流でき、子供たちはバスケットボールもできる、とても素敵な場所だったのです。


しかし問題がありました。この会場は入り口が非常に見つけにくい場所にあったのです。誰一人として見逃すことがないように、入り口にポスターを貼りました。
開始時刻は午後2時でした。午後2時まで待ちましたが、その時刻になっても誰も現れませんでした。中国のSolution Architectである Jason氏と二人で顔を見合わせるだけでした。参加者はゼロ。いるのは講演者だけという状況です。どうやってイベントを続けたらいいのか、全くアイデアが浮かびませんでした。しかし、非常に気まずい状況ではありましたが、部屋に戻ってイベントを開始しなければなりませんでした。

空っぽの部屋に向かって話さなければならないという、非常に恥ずかしい状況でした。講演者全員が後ろの壁に立って、誰もいない会場を見ていたのです。

しばらくして数人の人が来ましたが、実は彼らは階下のコーヒーショップでコーヒーを買って座る場所を探していただけでした。OpenSearchについて全くバックグラウンドがない人たちでしたが、それでもセッションを続けなければなりませんでした。幸いなことに、そのうちの一人がソフトウェアエンジニアであることがわかり、多くの質問をしてくれました。

しかし、最初のセッションが終わってからわずか30分後、状況は一変しました。多くの人が来始めたのです。

2番目のセッションでは、参加者が増えすぎて制御不能な状態になり、講演者は参加者が快適に過ごせるよう脇に立ってスペースを作らなければなりませんでした。最大50人を予想して60脚の椅子を用意していましたが、ピーク時には70人以上の参加者がいたと思います。多くの人が立ったまま聴講する状況となり、椅子が全く足りない状態になりました。
セッションの途中にティーブレイクがありました。コーヒーショップはビーフバーガーやケーキといった素晴らしいスナックを提供してくれましたが、それを求める参加者の行列が部屋を一周するほど長くなってしまいました。全員がスナックを受け取り終わるまで、次のセッションを延期せざるを得ない状況となりました。
このように色々なことがあったものの、初めてのコミュニティイベントは大成功に終わったわけです。

コミュニティ運営を通じた学び


これまでの経験から、中国のコミュニティを運営する上で学んだ重要なポイントがいくつかあります。
まず、中国の人々は非常に内気なことが多く、なかなか行動しない傾向があります。これは中国人の特徴として受け入れるしかありませんが、重要なのは、私たちが最初の一歩を踏み出せば、彼らも行動を起こしてくれるということです。ですから、コミュニティ側から積極的に最初の動きを作ることが大切です。
次に、中国のエンジニアは時々目に見えないかもしれませんが、心配する必要はありません。コミュニティは確実にそこに存在しています。彼らは非常に目立つ形では活動していないかもしれませんが、実際には多くの人がOpenSearchを使っており、時にはフィードバックも提供してくれます。
最後に、しばらく様子を見ることも大切です。辛抱強く待てば、コミュニティは必ず反応してくれます。最初は反応が見えなくても、焦らずに継続することが重要だと学びました。

コミュニティの今後の展望


最後に、2026年のOpenSearch中国コミュニティについての展望をお伝えします。
皆さんもご存知かと思いますが、2026年に中国本土でOpenSearchConが開催されることが決まっています。Linux Foundationの動きは予想以上に早く、既にOpenSearchCon上海を2026年3月17-18日に開催することが発表されました。

中国には様々な都市があるので、開催地選びは難しい判断だったと思います。
北京は中国の首都であり中国インターネット産業の発祥地、上海は金融の中心地でありGenAIの拠点、杭州はEコマースの中心地でDeepSeekの本拠地、深圳は特別商業区でいわば中国のベイエリアと呼ばれる場所です。
しかし最終的に、おそらくOpenSearchチームが上海にあるという理由が大きかったのでしょう、Linux Foundationは上海を中国で最初のOpenSearchCon開催地として選びました。

上海が開催地に決まったことで、このスライドも上海周辺のフードマップに変更しました。上海周辺には本当にたくさんの素晴らしい料理があります。この地域は昔、「米と魚の楽園」つまり最も豊かな地域と呼ばれていたため、多彩な料理文化が育まれてきました。
上海といえば、まず小籠包が思い浮かぶでしょう。非常に人気のある有名な中国の蒸し餃子で、上海ではどこでも味わうことができます。また、ワンタンも餃子の別の形として楽しめます。魚料理が食べたければ、南市に行くのがおすすめです。蘇州はデザートの楽園として知られており、蒸しケーキなど様々なスイーツが楽しめます。無錫ではすべての食べ物が甘い味付けになっており、甘いスペアリブや甘い魚など、独特の料理文化があります。嘉興は羊肉で有名で、寧波はあらゆる種類のシーフードで知られています。
もし404が何かわからなければ、中国の同僚に尋ねてみてください。彼らが答えてくれるはずです。

2025/11~12には、ByteDanceから重要なコントリビューションが予定されています。
それは、Vector計算エンジンとMPPに基づく分析クエリ処理の機能です。以前のセッションでPPLについて聞いたことがあるかもしれませんが、コミュニティでは全てのデータ処理フローの中間表現としてCalciteの論理プランを使用しようとしています。ByteDanceも同様のアプローチを取っていますが、彼らはSQL言語を使用しています。
言語や方言の違いはそれほど重要ではなく、本質的には同じことをしています。しかし、論理プランを物理プランに変換する際に、彼らは異なる方法を採用しています。それは計算を分散させるというアプローチです。全てのOLAPクエリにおいて、単一のスレッドやプロセスよりもはるかに大きな計算リソースが必要になるため、計算タスクを全ての利用可能なノードに分散させます。タスク分散、結合、ホスト処理のためのタスクスケジューラがあり、単一ノードでも集約タスクをベクトル化しようとしています。
彼らはVeloxエンジンを使用しており、今後、Veloxの実行を抽象化する方法について彼らと議論する予定です。OpenSearchは現在DataFusionという別のVectorベースのエンジンを使用しようとしているため、ユーザーにとってより多くの選択肢を提供したいと考えています。この貢献はVolcano Engineからではなく、ByteDance Ads Infraチームからのもので、彼らがElasticコミュニティバージョンからOpenSearchコミュニティバージョンへと全面的に移行している流れの中での大きな動きとなります。
OpenSearch中国コミュニティについて何か質問があれば、いつでも声をかけてください。上海で何が起こっているかについて話し合いましょう!