Bering Note – formerly 流沙河鎮

情報技術系のこと書きます。

Apache Iceberg Meetup「LanceとApache Icebergの統合 最新の進捗」- Jack Ye, LanceDB

Apache Iceberg Meetupのセッション「Lance Integration with Apache Iceberg - Latest Progress」をまとめます。 www.youtube.com スピーカー マルチモーダルAIが突きつけるデータ規模の課題 データウェアハウスからマルチモーダルレイクハウスへ 単一デー…

OpenSearchCon Europe 2026「OpenSearchのパフォーマンス向上: LuceneのBulk CollectionとgRPC Searchの実際」- Abdul Muneer Kolarkunnu & Carlos Rolo, NetApp Instaclustr

OpenSearchCon Europe 2026のセッション「Boosting OpenSearch Performance: Lucene Bulk Collection and gRPC Search in Action」をまとめます。 www.youtube.com スピーカー Lucene bulk collectionが解くアグリゲーションの性能課題 JVMのメソッドインラ…

Iceberg Summit 2026「Rust が拓く Iceberg の未来: Rust データエコシステムへの Iceberg 統合」- Sean (Yexiangchang), AWS

Iceberg Summit 2026のセッション「A Rusty Future: Bringing Iceberg to the Rust Data Ecosystem」をまとめます。 A Rusty Future: Bringing Iceberg to the Rust Data Ecosystem - YouTube スピーカー なぜ Iceberg Rust なのか この 1 年のコミュニティ…

OpenSearchCon Europe 2026「ホットスポットの先へ: ヒートを意識したシャード操作でOpenSearchの性能を変える」- Gaurav Bafna & Arpit Bandejiya, Amazon

OpenSearchCon Europe 2026のセッション「Beyond Hot Spots: Revolutionising OpenSearch Performance Through Heat-Aware Operations」をまとめます。 www.youtube.com スピーカー 現在のシャードアロケーションと重み関数の仕組み スケール時に崩れる前提…

Iceberg Summit 2026「オープンソースの革新と顧客価値をつなぐ:プロダクト視点で語る Apache Iceberg」- Kevin Liu(モデレーター)ほか Etleap・Snowflake・Databricks・Dremio・Ryft 各社

Iceberg Summit 2026のパネルディスカッション「Bridging Open Source Innovation with Customer Value: A Product Perspective」をまとめます。 Bridging Open Source Innovation with Customer Value: A Product Perspective - YouTube 登壇者 自己紹介と…

OpenSearchCon Europe 2026「基調講演オープニング:検索のモダナイゼーションとベクトルデータベースの現在地」- Bianca Lewis, OpenSearch Software Foundation

OpenSearchCon Europe 2026のセッション「Keynote: Opening Remarks」をまとめます。 www.youtube.com スピーカー プラハで迎えた OpenSearch コミュニティ5周年 すべてのデータベースがベクトル対応になった市場 導入した半数、できていない半数を分けるも…

Iceberg Summit 2026「バッチからストリーミング、そしてAIへ。みんなのための、みんなによるIceberg」- Russell Spitzer, Apache Iceberg PMC Member

Iceberg Summit 2026の基調講演(Apache Iceberg PMCメンバー Russell Spitzer)のまとめ。V1の3つの原子的操作からV2のdelete file、V3を経て、ストリーミングとAIに対応するV4まで、フォーマットの進化とコミュニティの歩みを解説します。

OpenSearchCon North America 2025「Uberが開発したOpenSearchのPull-Based Ingestionを深く理解する」- Varun Bharadwaj, Uber & Yupeng Fu, Uber

OpenSearchCon North America 2025のセッション「Deep Dive Into OpenSearch Pull-Based Ingestion at Uber」をまとめます。 www.youtube.com 資料 https://static.sched.com/hosted_files/opensearchconna2025/95/%5BExternal%5D%5BOpenSearchCon%2025%20US…

2026年01 - 05月のOSS活動振り返り

2026年前半のOSS活動の途中経過。数字のサマリ、プロジェクト別の内訳、代表的な活動の紹介、AIとの付き合い方など

FDEの逆を考える — リバースデプロイドエンジニアというアイデア

フォワードデプロイドエンジニア(FDE)の逆方向のワークスタイルとして『リバースデプロイドエンジニア』を提案するアイデア記事

opensearch-project/opensearch-hadoopのメンテナになった

このたび、わたしlawofcyclesはopensearch-project/opensearch-hadoopのメンテナに就任しました。 Hadoopエコシステム、中でもSparkとOpenSearchをより良く結べるように努力していく所存です。 opensearch-hadoop/MAINTAINERS.md at main · opensearch-proje…

2025年振り返り

あれやこれやと忙しくしていたら、気がつけば年末です。 2025年も大変お世話になりました。来年もよろしくお願いします。 今年は生成AIの急速な進化や、流動的な国際情勢、資本市場の不安定化など、IT業界も、それ以外の世界も変化に直面し、不確実性が加速…

OpenSearchのおもろさを語りたい

Distributed Computing Advent Calendar 2025の記事です。 検索技術やOpenSearchを最近知った筆者の視点で、OpenSearchプロジェクトの面白さを様々な角度から整理して、まとめてみました。

IcebergのMaterialized View仕様の検討状況

Apache Icebergコミュニティでは、Materialized View(マテリアライズドビュー、以下MV)の仕様策定が進んでいます。PR #11041はマージに向けた最終調整段階にあり、複数のコミッターからApproveを受けています。本記事では、最新の検討状況をご紹介します。

OpenSearchCon KOREA 2025「LINEにおける統合バックエンドとしてのOpenSearch:ログ基盤からAgentic Searchプラットフォームまで」- Sun Ro Lee, LINE

OpenSearchCon KOREA 2025のセッション「OpenSearch as the Unified Backend: From Log Storage to Agentic Search Platform at LINE」をまとめます。LINEのSun Ro Lee氏が、1,280を超えるクラスター、10PB以上のデータを管理するOpenSearchプラットフォーム…

OpenSearchCon North America 2025「GenAIOps - OpenSearchによるAI/生成AIプラットフォームのオブザーバビリティ」

OpenSearchCon North America 2025のセッション「GenAIOps - OpenSearch for AI & GenAI Platform Observability」をまとめます。TransUnionのRama Pabolu氏とRamesh Kumar Manickam氏が、GenAIシステムにおけるオブザーバビリティの実装方法を解説。ベクト…

OpenSearchCon North America 2025「OpenSearchのSnapshotをマスターする:基本から応用まで」- Ashish Singh & Chaitanya KSR, AWS

OpenSearchCon North America 2025のセッション「Mastering OpenSearch Snapshots: From Basics To Advanced Strategies - Ashish Singh & Chaitanya KSR」をまとめます。 本セッションでは、スナップショットの基本的な仕組みから、Searchable Snapshots、S…

OpenSearchCon North America 2025「ストリーミングでOpenSearchを高速化する:Apache Arrow, Flight, DataFusion, gRPC」- Saurabh Singh & Harsha Vamsi, AWS

OpenSearchCon North America 2025のセッション「Accelerating OpenSearch With Streaming: Apache Arrow, Flight, DataFusion and gRPC」をまとめます。AWSのSaurabh Singh氏とHarsha Vamsi氏が、OpenSearchのクエリエンジンを従来のバッチ処理からストリー…

OpenSearchCon North America 2025「OpenSearchにおけるApache Calciteを活用したPiped Processing Languageの実装」- Lantao Jin & Heng Qian, AWS

OpenSearchCon North America 2025のセッション「Implementing Piped Processing Language in OpenSearch Via Apache Calcite」をまとめます。 OpenSearchのPPL(Piped Processing Language)は、V2エンジンで実装の限界、最適化不足、テスト不足といった課…

ローカル環境でOpenSearchの様々な検索アプローチを手早く試す: opensearch-ml-quickstartの紹介

OpenSearchのML機能を試すためのツールキットopensearch-ml-quickstartの使い方を紹介します。 opensearch-ml-quickstartは、OpenSearchのML機能をローカル環境で手軽に試せるPythonツールキットです。Docker Composeでクラスタを起動し、Amazon PQAデータセ…

OpenSearchCon North America 2025「From Bug to PR: 顧客課題の解決をUpstreamへの貢献に繋げる」- Brian Graf & Alex Bunday, NetApp Instaclustr

OpenSearchCon North America 2025のセッション「From Bug To PR: Turning Customer Pain Points Into Upstream Contributions」をまとめます。 NetApp InstaclusterのBrian GrafとAlex Bundayが、顧客が抱える課題やバグを発見してから、それをトリアージし…

OpenSearchCon North America 2025「中国における活気あるOpenSearchのOSSコミュニティ成長の軌跡」- Charlie Yang, AWS

OpenSearchCon North America 2025のセッション「Growing a Vibrant Open Source OpenSearch Community in China」をまとめます。 Charlie Yang氏が、中国におけるOpenSearchコミュニティの成長について語りました。コミュニティミートアップでの試行錯誤や…

OpenSearchをSQLで検索する: OpenSearch SQL pluginの紹介

OpenSearchは、基本的にJSONベースの[DSL(query domain-specific language)](https://docs.opensearch.org/latest/query-dsl/)によってデータを検索します。 一方で、[SQLやPPL](https://docs.opensearch.org/latest/search-plugins/sql/index/)による検索も…

検証を目的にOpenSearchをコンテナで動かす

主に検証を目的にOpenSearchをコンテナで動かす際のメモ。

OpenSearchCon North America 2025「次世代の検索:UberとOpenSearchコミュニティが目指すCloud Native 3.0」- Shubham Gupta, Uber

OpenSearchCon North America 2025のセッション「Next-Gen Search: How Uber and the OpenSearch Community Built a Cloud Native 3.0」をまとめます。 UberがOpenSearch Software Foundationの創設メンバーとして、サーバーレス/クラスターレスなOpenSearch…

OpenSearchCon North America 2025「ベクトル検索のキャパシティ計画とスケーリング、最適化について」- Jon Handler, AWS

OpenSearchCon North America 2025のセッション「Capacity Planning, and Scaling/Optimization for Vector Workloads」をまとめます。 Amazon Web ServicesのJon Handler氏による、大規模ベクトル検索システムのサイジングと最適化に関する実践的なセッショ…

OpenSearchCon North America 2025「Derived Sourceによりデータを失わずにOpenSearchのストレージコストを削減する」- Mohit Godwani & Tanik Pansuriya, AWS

OpenSearchCon North America 2025のセッション「Derived Source: Slash Storage Costs Without Losing Data in OpenSearch」をまとめます。 このセッションでは、OpenSearch 3.2で導入されたDerived Sourceは、既存のDoc Valuesなどのデータ構造から_source…

OpenSearchCon North America 2025「OpenSearchのメモリ管理を探る:LuceneとJVMガベージコレクションの内部メカニズム」- Yeonghyeon Ko, SK hynix

OpenSearchCon North America 2025のセッション「Digging Into OpenSearch’s Memory: Lucene and JVM Garbage Collection Under the Microscope」をまとめます。 OpenSearchの安定運用に不可欠なメモリ管理について、JVMとLuceneの内部動作からGCチューニン…

OpenSearchCon North America 2025「OpenSearchのSearch Relevance Workbenchの紹介」- Eric Pugh, OpenSource Connections & Stavros Macrakis, AWS

OpenSearchCon North America 2025のセッション「Introducing OpenSearch’s Search Relevance Workbench!」をまとめます。 多くの組織が抱える「検索品質をどう改善すればよいかわからない」という課題に対し、データ収集から評価、チューニングまでを包括的…

OpenSearchCon North America 2025「DataFusionでOpenSearchをデータベースとして利用する」- Marc Handalian, AWS & Michael Froh, Uber

OpenSearchCon North America 2025のセッション「Using OpenSearch as a Database With DataFusion」をまとめます。 OpenSearchにプラガブルな実行エンジンを導入し、ベクトル化処理による高速な分析、分散結合、外部データソースとの統合を可能にする野心的…