医療情報ネット(ナビイ)は診療日や診療科目といった一般的な情報に加え、対応可能な疾患・治療内容、提供しているサービスなどさまざまな情報から、全国の医療機関を検索することのできるシステムです。
引用元:https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/iryou/teikyouseido/index.html
簡単にいうと、医療機関DB。情報をくまなく集めきるのは民間企業には不可能に近いので、公営だからこそできるサービスですね。
サイトのTOPページはこちらです。↓
www.iryou.teikyouseido.mhlw.go.jp
そんなナビイについて、so.laの辻さんがこんなツイートをされていました。
今日オープンの厚生労働省による医療機関を検索出来るサービス「医療情報ネット ナビィ」 https://t.co/YB1SYMZsHW
— 辻正浩 | Masahiro Tsuji (@tsuj) 2024年3月31日
期待していたけど、色々な面でSEOをガン無視したサイトになっていて残念すぎる。こういう所がSEOをちゃんとすればその価値は何倍にもなったのに……
これからの改善に期待したいです。
今回は自分の勉強のために「どのあたりが"SEOガン無視"なのか」を考えてみます。業界の方々のポストでいずれ答え合わせしよう。
医療機関DBは、どうあるべきか?
ナビイは、医療機関を見つけるためのDB(データベース)です。
ユーザーは、
・症状があり、医療機関を地域や条件から検索する人
・特定の医療機関について情報が欲しい人
の二種類が主でしょう。彼らがきちんと情報を得られる状態を目指すべきです。
きちんと情報が得られる、というのはつまり、
・サイト内の検索が容易で、老若男女誰でも情報にたどり着く方ができる
・サイト外で情報を探す人に発見されやすくする(webブラウザや、snsでの露出)
という状態だと言えます。
この状態が、理想だと定義できそうです。
現状のナビイの問題点
1.フリー検索を経由しないと、一覧・詳細ページへアクセスする手段がない
検索結果で露出することで、情報を検索する全ての人にナビイの保有する情報を届けるというミッションにおいて、大きな障壁となっているのがこの仕様です。
ナビイのTOPページには、『各都道府県から探す』というリンクが設置してあります。DBサイトで、このような形で一覧・詳細ページへのリンクを設置するのはあるある仕様だと思うのですが、ナビイはそうではありません。
各都道府県名をクリックすると、その都道府県に絞った検索の入口ページに飛びます。
このページ上にも、医療機関の一覧ページ・各医療機関の詳細ページへの導線はありません。当然、クローラーはサイト内検索を行いませんから、クローラーからそれらのページh発見不可能な状態になっています。
もし他サイトなどから引用される事があればそこからクローラーがやってくることはあるでしょうが、前述の
・症状があり、医療機関を地域や条件から検索する人
・特定の医療機関について情報が欲しい人
というニーズに応えられるページである一覧ページ・詳細ページに、サイト内からクローラーが全くアクセスできないのは致命的な仕様だと言えそうです。サイト内からのアクセスを今すぐ可能にすべきですが、もしすぐに仕様を変更できないのであれば、sitemap.xml を用いる方法があります。
しかし、現状ではsitemap.xmlも活用していない模様。ファイル自体は存在しているが過去に使われていたもののようで、記載されているURLは全てDNS_PROBE_FINISHED_NXDOMAINエラーです。。
https://www.iryou.teikyouseido.mhlw.go.jp/znk-web/sitemap.xml
2.重複が発生しやすい検索条件なのに、重複対策が行われていない
DB型サイトでは、ユーザーが自由に条件を選択してページを生成できるがゆえに、内容がほぼ全く同じページが複数生成されたり、多量の条件が選択されたニッチなページが生成されたりすることがよくあります。そうやって生成されたURLは、ほとんどのユーザーにとって無価値ですから、クローラーがそのページを見ても当然のようにインデックスされません。
こういった、インデックスすべきでないURLが日々多量に生成されると、それらがクローラーによって発見・クロールされ続けた結果として『このサイトが生成するURLはインデックスする価値が無い傾向にある』という学習をされてしまうリスクがあります。
検証をしたことがないので具体的に申せないのですが、一度この学習をされてしまうと、しばらくそのサイトはクロール頻度の回復に苦労しそうです。クロール頻度が少なくなることで、インデックスしてほしいページがなかなかインデックスされず検索結果への露出機会を損失する可能性があります。それに『このサイトが生成するURLはインデックスする価値が無い傾向にある』と判断される事自体、サイト全体の評価が低いとみなされているも同義なので、より一層検索結果での露出増加に苦戦しそうです。
上記のような事情があるので、規模の大きなサイトの運営者は特に、無駄なページの発見・クロールを抑制するべきなのですが、ナビイではその観点も考慮されていなさそうです。
例)以下の2ページの表示内容は全く同じだが、正規化・noindex・robotsでのブロックのいずれも行われていない
埼玉県川口市の外科、脳神経外科、他36科目の(病院、診療所)検索結果一覧
埼玉県川口市の外科、脳神経外科、他36科目の(病院、診療所)検索結果一覧
URL文字列を確認すると、?pref=11 というクエリパラメータの有無のみが違いのようです。どうやら、ユーザーの保有するCookieを参照して、そのユーザーが以前に選択した都道府県のディレクトリを自動的に選択する仕様になっているようです。
今回の場合では、前項で私が北海道のページにアクセスしたために、北海道のディレクトリが自動的に選択されていました。
パンくずリストも、
トップ>北海道>診療科目で探す(医療機関)>埼玉県川口市の外科、脳神経外科、他36科目
とおかしなことになっていました。
3.各都道府県の検索ページへ遷移するリンクが、全て javascript void(0) になっている(リンク先情報がクローラーに全く伝わらない)
この記述は、Javascriptで画面遷移を表現したいときにaタグでの遷移をあえて無効にするための方法なのですが、これではクローラーにリンク先のページについての情報が伝わりません。
ではどうしたら良かったのか?
以下、細かく施策化していないのですが、やるべきことを箇条書きしてみます。
- MUST
- インデックスさせるべきURLを決定する
- SEO PJTの場合は、検索需要の有無でボーダーを引くことも多いですね
- 上記以外で発生しうるURLを制御する
- robots.txtで明らかに不要なパラメータをブロックする
- 内容が重複する場合にcanonicalを設定する
- サイト内リンクを増加
- JSで表示しているコンテンツを極力HTML上に記載