コンピュータソフトウェア

高度な検索とクエリ言語。 検索エンジン言語

クエリ言語は、データベースや情報システムでクエリを作成するために使用される、人工的に作成されたプログラミング言語です。

一般に、そのような照会方法は、それらがデータベースに役立つか情報検索のために役立つかによって分類することができる。 違いは、そのようなサービスへのリクエストは、提示された質問に対する実際の回答を得るために行われ、検索エンジンは、関心領域に関する情報を含む文書をユーザに見つけることを試みることである。

データベース

データベースのクエリ言語には、次の例があります。

  • QL - オブジェクト指向、 リレーショナルデータベースを 指し ます。 データログの後継者。
  • コンテキスト(CQL)は、情報検索システム(Webインデックスや書誌ディレクトリなど)のための正式なクエリ表現言語です。
  • CQLF(CODYASYL) - CODASYL-TYPEデータベース用。
  • 概念指向のクエリ言語(COQL)は、それぞれのモデル(com)で使用されます。 これは、データモデリングの原則に基づいており、多次元分析、分析操作および結論の投影および非投影などの操作を拘束し、使用します。
  • DMX - データマイニングモデルに使用されます。
  • データログは、演繹データベースに対するクエリの言語です。
  • Gellish Englishは、Gellish Englishデータベースでのクエリに使用できる言語で、ダイアログ(クエリと回答)を実行できるほか 、 知識の 情報モデリングに も役立ちます。
  • HTSQL - http要求をSQLに変換します。
  • ISBL - PRTV(最初のリレーショナル データベース管理システムの 1つ)に使用され ます。
  • LDAPは、TCP / IPを使用するクエリおよびディレクトリサービスのためのプロトコルです。
  • OLAPデータベースにはMDXが必要です。

検索エンジン

検索クエリの言語は、検索エンジンでデータを見つけることを目的としています。 クエリーには、追加の構文(たとえば "and" / "or")を持つプレーンテキストまたはハイパーテキストが含まれている点が異なります。 これは、コマンド構文の厳密な規則によって規制されるか、位置パラメータを含む標準的な類似言語とは大きく異なります。

検索クエリはどのように分類されますか?

大部分の検索クエリには、情報、ナビゲーション、トランザクションという3つのカテゴリがあります。 この分類は理論的には固定されていませんが、検索エンジンでの実際のクエリの存在によって経験的に確認されました。

情報要求とは、何千もの関連する結果が得られる広範なトピック(例えば、特定の都市またはトラックモデル)をカバーするものです。

ナビゲーション - 特定のトピック(たとえば、YouTube)上の1つのサイトまたはWebページを検索するクエリです。

トランザクション - ユーザーが特定のアクションを実行する意図を反映します(たとえば、車の購入やチケットの予約など)。

検索エンジンはしばしば、あまり頻繁に使用されない第4のタイプのクエリをサポートします。 これらは、索引付けされたWebグラフィックスの接続性に関するレポート(特定のURLへのリンク数、または特定のドメインから索引付けされたページ数)を含む、いわゆる接続要求です。

情報の検索はどのように行われますか?

ほとんどの検索リソースは検索ログを公開していないため、ユーザーがWeb上で探している情報を見つけることは非常に困難です。 それにもかかわらず、最初の科学的研究は1998年に登場した。 その後、関連性の高い質問が分析された2001年のフォローアップ調査が実施されました。 検索エンジン がどのようにクエリ言語を使用しているかも明らかになりました。

ウェブ検索に関連するいくつかの興味深い特徴が分かった。

検索クエリの平均長は2.4ワードでした。

  • ユーザーの約半数が1つのリクエストを送信し、3分の1未満のユーザーが3つ以上のユニークなクエリを1つずつ作成しました。
  • ユーザーのほぼ半数が結果の最初の1ページまたは2ページしか表示しませんでした。
  • ユーザーの5%未満が高度な検索機能を使用しています(特定のカテゴリの選択や検索での検索など)。

カスタムアクションの機能

この調査では、クエリの19%に地理的な用語(名前、郵便番号、地理的オブジェクトなど)が含まれていることも示されています。 短いクエリ(つまり、いくつかの条件がある)に加えて、予測可能なスキームが存在することが多く、ユーザーが検索フレーズを変更したことに注意してください。

また、あるユーザーからのリクエストの33%が繰り返され、87%のケースでユーザーが同じ結果をクリックすることが判明しました。 これは、多くのユーザーが情報を再検討または再検索するために繰り返される要求を使用していることを示しています。

頻度クエリ分布

さらに、専門家は、クエリの頻度分布がべき乗則に対応していることを確認しました。 つまり、キーワードのうちのごく一部がリクエストの最大リスト(たとえば、1億以上)にあり、最も頻繁に使用されます。 同じ科目の残りのフレーズは、あまり頻繁ではなく個別に使用されます。 この現象はパレート原理 (または「ルール80-20」)と呼ばれデータベースの索引付けやパーティショニング、キャッシング、積極的なダウンロードなどの最適化手法を検索エンジンが使用できるようにし、検索エンジンのクエリの言語も向上させました。

近年、平均的なクエリの長さは徐々に増加していることが明らかになりました。 したがって、英語での平均クエリは長くなりました。 この点に関して、Googleは「Hummingbird」(2013年8月)という更新プログラムを導入しました。これは、非音声の「話し」のクエリ言語(「どこで最も近いコーヒーハウスがどこですか」など)で長い検索語句を処理することができます。

長い問合せでは、処理が使用されます。これらは、標準言語で作成されたフレーズに分割され、異なるパートへの回答が別々に表示されます。

構造化クエリ

論理演算 と構文をサポートする検索エンジンは、より高度なクエリ言語を使用します。 いくつかのトピックまたは顔を含む文書を検索するユーザは、単語の論理的特徴付けによってそれらの各々を記述することができる。 論理的な照会言語は、その核心に特定のフレーズと句読点の集合です。

高度な検索とは何ですか?

「Yandex」と「Google」のクエリ言語は、特定の条件のもとで、より具体的な検索を実行することができます。 詳細検索では、ページ名またはヘッダー接頭辞の一部、および特定のカテゴリや名前のリストを検索できます。 また、タイトル内の特定の単語を含むページや特定のトピックグループ内のページの検索を制限することもできます。 クエリ言語を正しく使用することで、可変エンドと同様のスペルの単語を含むユーザーによって与えられたものを含む、ほとんどの検索エンジンの表面結果よりも複雑なパラメータを処理できます。 詳細検索の結果を表示すると、ページの関連セクションへのリンクが表示されます。

特定のフレーズを含むすべてのページを検索することも可能ですが、標準クエリでは検索エンジンはディスカッションのどのページでも停止できません。 多くの場合、クエリ言語はnoindexタグ内にあるページにつながります。

場合によっては、適切な形式のクエリを使用すると、いくつかの特殊文字や他の アルファベットの文字( たとえば 中国語の 文字)を含む情報を見つけることができます。

クエリ言語の文字はどのように読み込まれますか?

大文字と小文字の区別、およびいくつかの発音記号(ウムラウトとアクセント)は検索に含まれません。 たとえば、「Citroen」というキーワードを検索しても、「Citroen」という単語を含むページは見つかりません。 しかし、一部の合字は個々の文字に対応しています。 例えば、 "aeroscope"という単語を検索すると、 "Ereskebing"(AE =Æ)を含むページを簡単に見つけることができます。

多くの英数字以外の文字は常に無視されます。 たとえば、文字列| L |を含むクエリに関する情報を見つけることは不可能です。 このシンボルがいくつかの変換テンプレートで使用されているにもかかわらず、2つの垂直バーの間の文字(2文字の縦棒) 結果はLTのデータのみになります。 「credit(Finance)」クエリでは、「credit(finance)」という正確な名前の記事があっても、「credit」と「finance」という単語を含む記事が表示され、括弧は無視されます。

クエリ言語で使用できる多くの関数があります。

構文

「Yandex」と「Google」のクエリ言語では、句読点を使用して検索を絞り込むことができます。 たとえば、中括弧{{search}}。 それらに囲まれたフレーズは、変更なしで完全に検索されます。

二重引用符で囲まれた句では、検索の対象を特定できます。 例えば、引用された単語は、比喩的に、または架空の文字として、引用符なしで、よりドキュメンタリーな性質の情報として使用されると認識されます。

さらに、すべての主要な検索エンジンは論理的な "not"のための " - "文字をサポートし、また/または。 例外は、ハイフンまたはダッシュの接頭辞を使用して区切られない用語です。

検索フレーズの不正確な対応には〜記号が付いています。 たとえば、用語やタイトルの正確な言葉を覚えていない場合は、指定した文字で検索文字列に指定すると、最も類似性の高い結果を得ることができます。

カスタム検索パラメータ

また、intitleやincategoryなどの検索パラメータもあります。 コロンで表示されるフィルタは、「filter:query string」の形式で表示されます。 クエリ文字列には、検索語句または部分または全ページ名を含めることができます。

関数 "intitle:query"は検索結果を名前で優先順位付けしますが、タイトルのコンテンツの通常の結果も表示します。 いくつかのこのようなフィルタを同時に使用することができます。 この機会の使い方は?

"intitle:airport name"という形式の要求は、タイトルの空港のタイトルを含むすべての記事を提供します。 あなたが「駐車場:空港名」としてそれを定式化すると、タイトルに空港名の記事を受け取り、本文に駐車場を記載します。

「カテゴリ:カテゴリ」フィルタの検索は、特定のグループまたはページのリストに属する記事を最初に発行する原則に基づいて動作します。 たとえば、 "Temples incategory:History"というタイプの検索クエリは、テンプルの履歴に関する結果を生成します。 この機能は、さまざまなパラメータを設定することにより、拡張機能としても使用できます。

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ja.atomiyme.com. Theme powered by WordPress.