Normalization filters

Normalization is the process of transforming words into standard forms, such as removing diacritics from characters or converting all text to lowercase, ensuring consistency and accuracy in search results, regardless of differences in word form.

A normalization token filter is a type of token filter in Elasticsearch that is used to standardize and transform text data to improve the quality of search and analysis. The normalization token filter performs various text normalization tasks, such as converting all characters to lowercase, removing diacritics, or replacing non-ASCII characters with their ASCII equivalents.

Commonly used normalization filters

Here is a list of common normalization filters used in Elasticsearch:

Introduction to Elasticsearch

Getting started on Elasticsearch

Text Analysis

Search on ElasticSearch

Aggregation

Conclusion

Integrate Elasticsearch in the Ruby on Rails Application

Custom Analyzers: Token Filters

Overview

Normalization filters

Commonly used normalization filters

Example