정규식(Regexp)이란 무엇입니까? 정의 및 의미

click fraud protection

정규식 또는 Regex(regexp라고도 함)는 일련의 문자로 정의된 검색 패턴을 설명하기 위한 표기법 시스템입니다. 주로 검색 및 바꾸기, 데이터 유효성 검사 및 문자열 구문 분석에 사용됩니다. Regex는 형식 언어 이론을 기반으로 하며 다음을 정의하는 상수("리터럴 문자"라고 함)로 구성됩니다. 이들에 대해 수행할 작업을 정의하는 문자열 및 연산자 기호("메타 문자"라고 함) 집합 세트.

Technipages는 정규 표현식(Regexp)을 설명합니다.

단일 검색어를 정규식 또는 패턴이라고 하며 단일 또는 집합을 일치시키는 데 사용됩니다. 목적에 따라 필요한 문자열이므로 동일한 패턴과 일치하는 패턴을 정의하는 여러 방법이 있습니다. 문자열.
각 패턴 내부에는 문자가 말하는 숫자, 문자 또는 기호를 의미하는 "a"와 같은 리터럴 문자가 있습니다. 정의된 의미를 갖는 "{"와 같은 메타 문자는 관련 문자가 해석되는 방식을 변경하거나 와일드카드 유형으로 작동하거나 하위 표현식 등을 정의할 수 있습니다. 마지막으로 메타 문자를 리터럴 문자로 바꾸는 데 사용되는 이스케이프 문자 "\"가 있습니다.

정규식에는 두 가지 표준 세트가 있습니다. "Perl 호환"은 표현력과 읽기 용이성으로 잘 알려진 Perl 언어의 정규식 구현을 기반으로 합니다. 다른 표준은 "IEEE POSIX"로 두 가지 맛이 있으며 확장된 풍미는 3개의 메타 문자를 추가하고 기본 풍미와 비교하여 다른 사람들이 작동하는 방식을 수정합니다.

수학자 스티븐 콜(Stephen Cole)은 그가 “정규 언어”라고 불렀던 수학적 표기법으로 정규 언어를 처음 기술했습니다. 1951년, 1968년에 정규 표현식이 패턴 일치를 위한 텍스트 편집기에서 주류를 이루었습니다. 컴파일러. 그 이후로 Regex는 다양한 프로그래밍 언어와 고급 텍스트 편집기로 구현되어 여러 표준 regex 라이브러리를 쉽게 재사용할 수 있습니다.

정규식(Regexp)의 일반적인 사용

  • 정규식 구문은 복잡합니다.
  • 정규식은 강력한 찾기 및 바꾸기 도구입니다.
  • Regex에는 서로 다른 목적으로 사용되는 두 가지 표준 세트가 있습니다.

정규 표현식(Regexp)의 일반적인 오용

  • 정규식은 프로그래밍 언어입니다.