Čo je regulárny výraz (Regexp)? definícia a význam

Regulárny výraz alebo Regex (tiež regexp) je systém zápisu na opis vyhľadávacieho vzoru definovaného sekvenciou znakov. Primárne sa používa na vyhľadávanie a nahradzovanie, overovanie údajov a analýzu reťazcov. Regex je založený na teórii formálneho jazyka a pozostáva z konštánt (nazývaných „doslovné znaky“), ktoré definujú množiny reťazcov a operátorových symbolov (nazývaných „metaznaky“), ktoré definujú operácie, ktoré sa s nimi majú vykonať súpravy.

Technipages vysvetľuje regulárny výraz (regexp)

Jednotný hľadaný výraz sa nazýva regulárny výraz alebo vzor a používa sa na priradenie jedného výrazu alebo množiny výrazov reťazcov podľa potreby, existuje viacero spôsobov, ako definovať vzor, ​​ktorý sa bude zhodovať struny.
Vo vnútri každého vzoru sú doslovné znaky, ako napríklad „a“, ktoré doslova znamenajú to, čo znak hovorí, či už ide o číslicu, písmeno alebo symbol. Metaznaky, ako napríklad „{“, ktoré majú definovaný význam, môžu zmeniť spôsob interpretácie súvisiacich znakov, pôsobiť ako typ zástupného znaku alebo definovať podvýraz atď. Nakoniec je tu únikový znak „\“, ktorý sa používa na premenu metaznaku na doslovný znak.

Existujú dva súbory štandardov pre regulárny výraz: „Perl kompatibilný“, ktorý je založený na implementácii regulárneho výrazu v jazyku Perl, ktorý je známy svojou výrazovou silou a relatívnou ľahkosťou čítania. Ďalším štandardom je „IEEE POSIX“, ktorý má dve príchute, rozšírená príchuť pridáva 3 metaznaky a upravuje fungovanie iných v porovnaní so základnou príchuťou.

Matematik Stephen Cole prvýkrát opísal regulárne jazyky v matematickom zápise, ktorý nazval „regulárny“. udalosti“ v roku 1951, v roku 1968 sa regulárny výraz stal hlavným prúdom v textových editoroch na porovnávanie vzorov a v kompilátorov. Odvtedy bol Regex implementovaný v mnohých rôznych programovacích jazykoch a pokročilých textových editoroch, množstvo štandardných regex knižníc je ľahko dostupných na opätovné použitie.

Bežné použitie regulárneho výrazu (regexp)

  • Syntax regulárneho výrazu je zložitá.
  • Regulárny výraz je výkonný nástroj na vyhľadávanie a nahradzovanie.
  • Regex má dve sady noriem používaných na rôzne účely.

Bežné nesprávne použitie regulárneho výrazu (regexp)

  • Regulárny výraz je programovací jazyk.