読者です 読者をやめる 読者になる 読者になる

はてなブックマーク開発ブログ

機能変更、お知らせなど

自然言語処理技術を用いたはてなブックマークの新機能「トピック」をベータリリースしました

こんにちは、はてなブックマークのディレクター id:jusei です。本日、はてなブックマークの新機能「トピック」をベータリリースしました。現在はPC版でのみご利用いただけます。スマートフォン版、iOSアプリ、Androidアプリでは順次対応していきます。

新機能「トピック」では、「人気エントリー」に掲載されている記事の中から関連性の高い記事をまとめ、さらにそれ以外の関連エントリーも含めて一覧できる「トピックページ」を生成します。各トピックの見出しは、自然言語処理技術を用いて自動生成しております。トピックページの生成対象は、過去10年間に蓄積されたはてなブックマークの全エントリーです。

2015年1月のトピック2005年2月のトピック

トピックページには、ユーザーの皆さまの間で多く話題になっている記事を抜粋して表示する「ハイライト」、すべての記事を表示する「新着」の2つの表示モードがあります。

「W杯」「オリンピック」「WWDC」など大きな出来事、事件・事故などがあった際に、関連性の高い複数の記事にブックマークが集まることがあります。トピックページの導入により、そういった場合でも人気エントリーが特定の話題の記事で埋め尽くされるといったことがなくなり、はてなブックマークに集まるより多彩な情報との出会いが生まれると期待しております。

トピックを集めた「トピックリストページ」では、日付別に一覧表示します。過去のトピックについてもそれぞれ年月日ごとに表示できます。雑誌を読むような感覚でインターネット上での話題を眺めたり、過去のカレンダーをめくるイメージで出来事を振り返ったりできます。


f:id:hatenabookmark:20150205110504p:plain:w600

本機能についてはベータリリース期間を約半年ほど設けています。より多くのユーザーの皆さまに便利に使っていただける機能へとブラッシュアップしていきますので、本機能を利用してのご感想などを、この記事のコメントまたはブックマークコメントでお知らせいただければ幸いです。

はてなブックマーク10周年にあたって


はてなブックマークは2015年2月10日でベータリリースから10周年を迎えます。はてなブックマークは2015年1月、数年ぶりに歴代最高PV/UUを更新しました。これは、10周年を目前とした2014年に10個の企画、多くの機能を新たに導入し、ユーザーの皆さまに日々ご利用いただいたことによるものです。

10周年という節目となる2015年は、これまでのインターネットサービスでは実現し得なかった新機能への挑戦をテーマとし、ユーザーの皆さまに「次の10年も使いたい」と思っていただけるサービスへの進化を目指します。その目標に向けてこの1年間は、15個の新企画を進めていきます。

自然言語処理技術を用いてトピックページが誕生した背景


2015年の新企画の第1弾として、このトピックページがあります。この機能は、これまでも多くのエンジニアが挑戦しながら、さまざまな要因により実現できていませんでした。しかし、自然言語処理の分野で研究してきた id:skozawa が最新の技術動向とこれまでの研究経験など基に膨大な量のデータ処理に挑戦したこと、Elasticsearch を本格採用したことにより、ベータリリースへとこぎ着けることができました。

id:skozawa は、以下のように述べています。

はてなブックマークが始まった2005年と比較して、自然言語処理の研究は多くの実験を通して飛躍的に進化し続けています。形態素解析、構文解析、トピックモデル、要約技術などさまざまな自然言語処理に関する研究論文を参考にして実装したのがこの「トピック」です。この実装の裏側については、今後「Hatena Developer Blog」にて公開する予定です。


はてなブックマークの「次の10年」への進化に向け、こういった研究分野における技術を積極的にサービスへ取り込み、より利便性の高い機能、既存のインターネットサービスにはない新しい体験を、ユーザーの皆さまへ提供し続けていきたいと考えております。

引き続き、はてなブックマークをどうぞよろしくお願いいたします。