[js] 정규식 표현법
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.
출처 : http://sir.co.kr/bbs/board.php?bo_table=pg_tip&wr_id=13563
내가 작성할려고 했는데, 검색해보니 잘 정리된 자료가 있다.
Design pattern 에서 저자가 세상의 대부분의 문제는 이미 해결된 적이 있고, 디자인 패턴도 그런 해결의 기록이라고 했는데
(문구 하나하나까지 정확하진 않고 대략 그런식의 말을 한적이 있는걸로 기억된다.)
역시 웹의 세계는.... 감사할 정도로 자료가 많다.
새로 작성할 만한 글이 별로 없을 정도로...
어쨌든 중-고급 개발자로 올라서려면 확실히 알고 활용할줄 알아야 하므로 필공 하도록하자
본 문서의 저작권은 anti-nhn license에 따릅니다.
*본 페이지에는 자바스크립트가 많이 들어있습니다. 자바스크립트가 실행되지 않으면 제대로 보이지 않습니다.
*본 페이지는 IE용 태그를 사용하였으므로, firefox 등에서는 정상작동하지 않을 수 있습니다.
*테스트를 해보실라문 요기를 클릭
*본 페이지는 IE용 태그를 사용하였으므로, firefox 등에서는 정상작동하지 않을 수 있습니다.
*테스트를 해보실라문 요기를 클릭
차례
- 1. 정규식이란?
- 2. 정규식 만들기
- 3. 정규식 표현법
- 4. 정규식 사용 예제
- 5. Javascript 정규식 함수
- 6. 정규식으로 만든 유용한 Javascript 함수
- 7. Java 정규식 함수
1. 정규식이란?
- String의 검색, 치환, 추출을 위한 패턴.
- 언어별 사용법은 대동소이함.
- 패턴예>전화번호 형식, 이메일 형식 등.
2. 정규식 만들기
- Javascript
- var regexp = /pattern/[flags] ;
var test = regexp.test(to be checked) - var regexp = new RegExp("pattern"[, "flags"]);
var test = regexp.test(to be checked) - flags for javascript
- g : global match, 일반적으로 패턴이 1번만 발견되면 찾기를 종료하지만, g flag가 있으면, 문자열 내에서 모든 패턴을 찾는다.
- i : ignore case, 대소문자를 고려하지 않고 체크한다.[a-z]와 [A-Z]는 같은 표현이 된다.
- m : match over multiple lines, 여러 줄에 걸쳐 체크를 한다.
- Java
- java.util.regex package
- Pattern p = Pattern.compile("pattern");
Matcher m = p.matcher("string to be checked");
boolean b = m.matches(); - boolean b = Pattern.matches("pattern", "string to be checked");
3. 정규식 표현법
*ⓥ는 valid, ⓘ는 invalid
*형광 초록 바탕 부분은 매칭되는 부분.
*예제는 javascript 기준이며, 언어에 따라 다소 차이가 발생할 수 있다.
문자 | 용도 | 예제 |
---|---|---|
\ |
|
|
^ | 문자열의 시작. []안에서는 not의 의미 * ^A는 "A로 시작"이라기 보다는 "시작 직후에 A가 나온다"는 의미로 해석하는 것이 좋다. 즉, 시작과 끝과 같은 빈 공간을 하나의 문자로 간주하는 것이 좋다. | /^A/g
|
$ | 문자열의 마지막 | /t$/
|
* | 0번 이상 반복 | /ab*d/g
|
+ | 1번 이상 반복 ( = {1,} ) | /ab+d/g
|
? | 0번 이나 1번 | /e?le?/g
|
. | new line 을 제외한 모든 글자 | /.n/g
|
(x) | x를 체크하고 체크한 값을 변수로 저장 | /(f..) (b..)/
|
(?:x) | x를 체크하고 체크한 값을 변수로 저장하지 않음 | /(?:f..) (b..)/
|
x|y | x 또는 y | /green|red/
|
x(?=y) | x후에 y가 나오고, x부분만 매칭되는 부분으로 간주 | /blah(?=soft|hard)/
|
x(?!y) | x가 나오고 그 뒤에 y가 있으면 안 됨 | /blah(?!hard)/
|
{n} | 앞에 지정한 것이 n개 | /.{3}/
|
{n,} | 앞에 지정한 것이 n개 이상 | /.{3,}/
|
{n,m} | 앞에 지정한 것이 n~m개 | /.{3,5}/
|
[xyz] | x나 y나 z. []안에는 얼마든지 쓸 수 있다. | /[abc]{2}/
|
[x-z] | x에서 z까지 | /[a-z]{4,}/g
|
[^xyz] | x,y,z를 제외한 나머지 모든 것 | /[^a-z]{2,}/g
|
[\b] | 백스페이스. \b와 혼동하지 말것. | /[\b]/g
|
\b | 단어의 경계.[\b]와 혼동하지 말것. | /\bn[a-z]/g
|
\B | \b 를 제외한 전부 | /\Bn[a-z]/g
|
\cX | 컨트롤X와 매칭. \cM은 컨트롤M과 매칭 | |
\d | 숫자.[0-9]와 같음 | /\d/g
|
\D | \d 를 제외한 전부 | /\D/g
|
\f | form-feed | |
\n | new line | |
\r | carriage return | |
\s | white space ex>탭, 띄어쓰기, \n, \r | /k\s/g
|
\S | \s 를 제외한 전부 | /k\S/g
|
\t | 탭 | |
\v | vertical tab | |
\w | 알파벳+숫자+_. [A-Za-z0-9_]와 동일 | /\w/g
|
\W | \w 빼고 전부 | /\W/g
|
\n | \n이 자연수일때, ()로 지정한 n번째 정규식 | /(.{2})e tru\1 is out \1ere/
|
\xhh | hh는 hexacode, | /[\x21-\x40]/g
|
\uhhhh | hhhh는 hexacode, | /[\u3131-\u3163\uac00-\ud7a3]/g
|
4. 정규식 사용 예제
/^[0-9]/
|
/^\w+$/
|
/^[a-zA-Z][\w\-]{4,11}$/
|
/^[0-9]{2,3}-[0-9]{3,4}-[0-9]{4}/
|
/^0\d{1,2}-[1-9]\d{2,3}-\d{4}$/
|
/^[\.a-zA-Z0-9\-]+\.[a-zA-Z]{2,}/
|
/^(?:[\w\-]{2,}\.)+[a-zA-Z]{2,}$/
|
/^[_a-zA-Z0-9\-]+@[\._a-zA-Z0-9\-]+\.[a-zA-Z]{2,}/
|
/^[\w\-]+@(?:[\w\-]{2,}\.)+[a-zA-Z]{2,}$/
|
/^([a-z]+):\/\/((?:[a-z\d\-]{2,}\.)+[a-z]{2,})(:\d{1,5})?(\/[^\?]*)?(\?.+)?$/i
|
/^[ㄱ-ㅣ가-힣]+$/
|
5. Javascript 정규식 함수
함수 | 코드예제 | 코드설명 |
---|---|---|
Array RegExp.exec (to be checked) | var myRe=/d(b+)(d)/ig; var myArray = myRe.exec("cdbBdbsbz"); /d(b+)(d)/gi
| myArray.index =1 ; (처음으로 매칭되는 위치, 컴터가 늘 그렇듯 위치는 0번째부터 센다.) myArray.input = cdbBdbsbz; (체크할 대상) myArray[0] = dbBd;(검사에 통과한 부분) myArray[1] = bB;(1번째 괄호에서 체크된 부분) myArray[2] = d;(2번째 괄호에서 체크된 부분) myRe.lastIndex =5 ; (다음번 체크를 하기위한 위치.) myRe.ignoreCase = true; (/i 플래그 체크) myRe.global = true; (/g 플래그 체크) myRe.multiline = false; (/m 플래그 체크) RegExp.$_ = cdbBdbsbz;(입력한 스트링) RegExp.$1 = bB;(1번째 괄호에서 체크된 부분 ) |
boolean RegExp.test(to be checked) | var myRe=/d(b+)(d)/ig; var checked = myRe.test("cdbBdbsbz"); document.write("checked = " + checked +";<br>"); /d(b+)(d)/gi
| 실행결과: checked = true; |
String RegExp.toString() | var myRe=/d(b+)(d)/ig; var str = myRe.toString(); document.write(str); | 실행 결과: /d(b+)(d)/gi |
String String.replace(pattern or string, to be replaced) | var str = "abcdefe"; document.write(str.replace("e" , "f")); | 실행 결과: abcdffe e가 2번 있지만, 첫번째 인자가 정규식이 아니라 문자열일 경우는 첫번째 것만 바꾼다. |
var str = "aba"; document.write(str.replace(/^a/ , "c")); | 실행 결과: cba | |
var re = /(\w+)\s(\w+)/; var str = "John Smith"; newstr = str.replace(re, "$2, $1"); document.write(newstr) | 실행 결과: Smith, John re에 의해서 찾아진 문자열 들은 re에서 ()로 표현된 순서대로 $1, $2와 같이 변수로 저장된다. | |
var re = /\s(?:http|https):\/\/\S*(?:\s|$)/g; var str = "url is http://iilii.egloos.com/ !!\n"; str += "blah home: http://www.blah.co.kr"; newstr = str.replace(re, function (str,p1,offset,s) { return "<a href='" + str + "'>" + str + "</a>"; } ).replace(/\n/, "<br>"); document.write(newstr); | url is http://iilii.egloos.com/ !! blah home: http://www.blah.co.kr str: 찾은 문자열 p1: ()에서 검색된 1번째 문자열. 마찬가지로 p2,p3 등도 가능 offset: str을 찾은 위치 s : 원본 문자열. | |
Array String.match(regular expression | var str = "ABCdEFgHiJKL"; var myResult = str.match(/[a-z]/g ); for(var cnt = 0 ; cnt < myResult.length; cnt++){ document.write(cnt +":" + myResult[cnt] +"<br>"); } document.write("비교<br>"); var str = "ABCdEFgHiJKL"; var myResult = /[a-z]/g.exec(str); for(var cnt = 0 ; cnt < myResult.length; cnt++){ document.write(cnt +":" + myResult[cnt] +"<br>"); } | 실행 결과: 0:d 1:g 2:i 비교 0:d String.match(RegExp) =>g flag가 있으면 다 찾아낸다. RegExp.exec(String) =>g flag가 있어도, 한 개만 찾고 끝낸다. |
Array String.split([separator[, limit]]) | var str = "ABCdEFgHiJKL"; var myResult = str.split(/[a-z]/g , 3); for(var cnt = 0 ; cnt < myResult.length; cnt++){ document.write(cnt +":" + myResult[cnt] +"<br>"); } | 실행 결과: 0:ABC 1:EF 2:H 주어진 문자열을 separator를 기준으로 limit 만큼 자른다. |
6. 정규식으로 만든 유용한 Javascript 함수
String removeTags(input)HTML tag부분을 없애준다 |
function removeTags(input) { return input.replace(/<[^>]+>/g, ""); }; |
example> var str = "<b>blah</b> <i>soft</i>"; document.write(str +"<br>"); document.write(removeTags(str)); blah soft blah soft |
String String.trim()문자열의 앞뒤 공백을 없애준다. |
String.prototype.trim = function() { return this.replace(/^\s+|\s+$/g, ''); }; |
example> var str = " untrimed string "; document.write("========" + str+ "==============<br>"); document.write("========" + str.trim() + "=============="); ======== untrimed string ============== ========untrimed string============== |
String String.capitalize()단어의 첫 글자를 대문자로 바꿔준다. |
String.prototype.capitalize = function() { return this.replace(/\b([a-z])/g, function($1){ return $1.toUpperCase(); }) ; }; |
example> var str = "korea first world best"; document.write(str.capitalize()); Korea First World Best |
String number_format(input)입력된 숫자를 ,를 찍은 형태로 돌려준다 |
function number_format(input){ var input = String(input); var reg = /(\-?\d+)(\d{3})($|\.\d+)/; if(reg.test(input)){ return input.replace(reg, function(str, p1,p2,p3){ return number_format(p1) + "," + p2 + "" + p3; } ); }else{ return input; } } |
example> document.write(number_format(1234562.12) + "<br>"); document.write(number_format("-9876543.21987")+ "<br>"); document.write(number_format("-123456789.12")+ "<br>"); 1,234,562.12 -9,876,543.21987 -123,456,789.12 |
7. Java 정규식 함수
Pattern p = Pattern.compile("(a*)(b)"); Matcher m = p.matcher("aaaaab"); if (m.matches()) { for (int i = 0; i < m.groupCount() + 1; i++) { System.out.println(i + ":" + m.group(i)); } } else { System.out.println("not match!"); } result> 0:aaaaab 1:aaaaa 2:b 0번째는 매칭된 부분. |
String a = "I love her"; System.out.println(a.replaceAll("([A-Z])", "\"$1\"")); result> "I" love her 자바도 $1을 쓸 수 있다. |
Pattern p = Pattern.compile("cat"); Matcher m = p.matcher("one cat two cats in the yard"); StringBuffer sb = new StringBuffer(); while (m.find()) { m.appendReplacement(sb, "dog"); System.out.println(sb.toString()); } m.appendTail(sb); System.out.println(sb.toString()); result> one dog one dog two dog one dog two dogs in the yard |
'Web > javascript / jQuery' 카테고리의 다른 글
자바스크립트 즉시 실행 함수의 불편한 진실 (4) | 2015.04.16 |
---|---|
[js] ]innerHTML로 <script> 넣기 (2) | 2015.04.16 |
[jQuery] SlickGrid 에서 각 행을 루프돌면서 상태에 따른 색상 세팅하기 (2) | 2015.04.13 |
TypeError: 'undefined' is not a function (evaluating '$(document)') (130) | 2015.04.13 |
[펌] 자바스크립트 문자열 다루기 (6) | 2015.04.13 |