Bering Note – formerly 流沙河鎮

情報技術系のこと書きます。

OpenSearchCon North America 2025「Derived Sourceによりデータを失わずにOpenSearchのストレージコストを削減する」- Mohit Godwani & Tanik Pansuriya, AWS

OpenSearchCon North America 2025のセッション「Derived Source: Slash Storage Costs Without Losing Data in OpenSearch」をまとめます。 このセッションでは、OpenSearch 3.2で導入されたDerived Sourceは、既存のDoc Valuesなどのデータ構造から_source…

OpenSearchCon North America 2025「OpenSearchのメモリ管理を探る:LuceneとJVMガベージコレクションの内部メカニズム」- Yeonghyeon Ko, SK hynix

OpenSearchCon North America 2025のセッション「Digging Into OpenSearch’s Memory: Lucene and JVM Garbage Collection Under the Microscope」をまとめます。 OpenSearchの安定運用に不可欠なメモリ管理について、JVMとLuceneの内部動作からGCチューニン…

OpenSearchCon North America 2025「OpenSearchのSearch Relevance Workbenchの紹介」- Eric Pugh, OpenSource Connections & Stavros Macrakis, AWS

OpenSearchCon North America 2025のセッション「Introducing OpenSearch’s Search Relevance Workbench!」をまとめます。 多くの組織が抱える「検索品質をどう改善すればよいかわからない」という課題に対し、データ収集から評価、チューニングまでを包括的…

OpenSearchCon North America 2025「DataFusionでOpenSearchをデータベースとして利用する」- Marc Handalian, AWS & Michael Froh, Uber

OpenSearchCon North America 2025のセッション「Using OpenSearch as a Database With DataFusion」をまとめます。 OpenSearchにプラガブルな実行エンジンを導入し、ベクトル化処理による高速な分析、分散結合、外部データソースとの統合を可能にする野心的…

OpenSearchCon North America 2025「Uberが開発したOpenSearchのPull-Based Ingestionを深く理解する」- Varun Bharadwaj, Uber & Yupeng Fu, Uber

OpenSearchCon North America 2025のセッション「Deep Dive Into OpenSearch Pull-Based Ingestion at Uber」をまとめます。 UberがOpenSearch 3.0に貢献した新機能であるPull-based Ingestionについて、技術的な詳細とアーキテクチャを解説。KafkaやKinesis…

翻訳: OpenSearchへのコントリビューションのはじめかた: 私の経験に基づくビギナーズガイド

本投稿は OpenSearch Project Blog "How to start contributing to OpenSearch: A beginner’s guide based on my journey" の日本語訳です。 OpenSearchは、開発者や組織がスケーラブルでリアルタイムな検索ソリューションを構築できる強力なオープンソース…

OpenSearchCon North America 2025「キーノート:UberにおけるOpenSearchを使った発展的な検索と可観測性」 - Shanshan Song, Uber

OpenSearchCon North America 2025のキーノートの「Advancing Search and Observability at Uber with OpenSearch」をまとめます。 Uberでは、様々なユースケースでOpenSearchが非常に大規模に活用されています。1日500億を超えるリクエストを処理する検索プ…

OpenSearchCon North America 2025「キーノート:SAPにおけるOpenSearchによるオブザーバビリティ」 - Hariharan Gandhi, SAP

OpenSearchCon North America 2025のキーノートのうち「SAP & OpenSearch Observability A trustful path to innovation」のパートをまとめます。 youtu.be スピーカー SAP Business Technology PlatformとOpenSearch SAP Cloud Logging Service OpenSearch…

OpenSearchCon North America 2025「キーノート:ベクトル検索の加速」 - Corey Nolet, NVIDIA

OpenSearchCon North America 2025のキーノートのうち「Accelerated Vector Search」のパートをまとめます。NVIDIA Principal ArchitectのCorey Nolet氏が、GPU加速によるベクトル検索の革新的な高速化技術について発表しました。オープンソースライブラリcu…

OpenSearchCon North America 2025「キーノート:OpenSearchコミュニティ -共に未来を作る-」 - Carl Meadows

OpenSearchCon North America 2025のキーノートのうち「The OpenSearch Community Building the future together」のパートをまとめます。

Kafka Iceberg Sink ConnectorによるRDBMSからIcebergへのCDCの現状と留意点

本エントリでは、RDBMSからIcebergへのCDCユースケースでの活用が期待されるIceberg Sink Connectorの現状と留意点を整理します。 このコネクタを活用する際には、Tabularから寄贈された歴史的経緯によって2つの実装が存在しており、両者に差分がある点を理…

新刊『実践Apache Iceberg』の紹介と執筆の思い出

『実践Apache Iceberg —⁠— 高効率・高生産性を実現するオープンなデータ基盤の構築と運用』という書籍が8月27日に発売されます。 本書は、データ基盤の構築や運用、活用に関わるエンジニアの方々に向けて、次世代のデータ基盤を支えるオープンテーブルフォー…

OpenSearchの検索速度を向上するConcurrent segment searchを理解する

本記事では、OpenSearchの検索性能を向上させる仕組みである「Concurrent segment search」について解説します。 OpenSearchはスケーラブルで多様なユースケースに対応できるオープンソースの検索エンジンです。 Concurrent segment searchは、従来直列に処…

OpenSearchCon Europe 2024「様々なワークロードにおけるマルチテナント設計」 - Jon Handler, AWS

OpenSearchCon Europe 2024のセッション「Multi-tenancy for all workloads」を日本語でまとめます。 可能な限り正確に内容を拾えるようにリスニングに努めたつもりですが、もし誤りがあればご指摘ください。 OpenSearchCon とは? Multi-tenancy for all wo…

OpenSearchCon North America 2024「AI/MLは情報検索をどのように変えているか」 - Jon Handler, AWS

OpenSearchCon North America 2024のセッション「How AI/ML is changing information retrieval」を日本語でまとめます。 可能な限り正確に内容を拾えるようにリスニングに努めたつもりですが、もし誤りがあればご指摘ください。 OpenSearchCon とは? How A…