Adding initial cut of JS regexp parser
This commit is contained in:
parent
9136e3f37e
commit
abd8a52f6b
@ -1,3 +1,3 @@
|
||||
import parser from './parser.peg';
|
||||
import parser from './parser/javascript.peg';
|
||||
|
||||
console.log('testing:', parser.parse('[0,1,2,3]'));
|
||||
window.parser = parser;
|
||||
|
@ -1,4 +0,0 @@
|
||||
grammar Lists
|
||||
value <- list / number
|
||||
list <- "[" ( value ("," value)* )? "]"
|
||||
number <- [0-9]
|
86
src/js/parser/javascript.peg
Normal file
86
src/js/parser/javascript.peg
Normal file
@ -0,0 +1,86 @@
|
||||
grammar JavascriptRegexp
|
||||
root <- regexp_literal / regexp
|
||||
regexp_literal <- "/" regexp "/" [igm]*
|
||||
regexp <- match ( "|" regexp )?
|
||||
match <- anchor_start? ( ( subexp / charset / terminal ) repeat? )* anchor_end?
|
||||
anchor_start <- "^"
|
||||
anchor_end <- "$"
|
||||
repeat <- ( repeat_any / repeat_required / repeat_optional / repeat_spec ) repeat_greedy?
|
||||
repeat_any <- "*"
|
||||
repeat_required <- "+"
|
||||
repeat_optional <- "?"
|
||||
repeat_spec <- "{" [0-9]+ "," [0-9]+ "}"
|
||||
/ "{," [0-9]+ "}"
|
||||
/ "{" [0-9]+ ",}"
|
||||
/ "{" [0-9]+ "}"
|
||||
repeat_greedy <- "?"
|
||||
subexp <- "(" ( subexp_no_capture / subexp_positive_lookahead / subexp_negative_lookahead )? regexp ")"
|
||||
subexp_no_capture <- "?:"
|
||||
subexp_positive_lookahead <- "?="
|
||||
subexp_negative_lookahead <- "?!"
|
||||
charset <- "[" "^"? ( charset_range / charset_terminal )* "]"
|
||||
charset_range <- charset_terminal "-" charset_terminal
|
||||
charset_terminal <- charset_escape / charset_literal
|
||||
charset_escape <- ( backspace_esc
|
||||
/ control_esc
|
||||
/ digit_esc
|
||||
/ non_digit_esc
|
||||
/ form_feed_esc
|
||||
/ line_feed_esc
|
||||
/ carriage_return_esc
|
||||
/ white_space_esc
|
||||
/ non_white_space_esc
|
||||
/ tab_esc
|
||||
/ vertical_tab_esc
|
||||
/ word_esc
|
||||
/ non_word_esc
|
||||
/ octal_esc
|
||||
/ hex_esc
|
||||
/ unicode_esc
|
||||
/ null_esc
|
||||
/ literal_esc )
|
||||
charset_literal <- [^\\\]]
|
||||
terminal <- any_character / escape / literal
|
||||
any_character <- "."
|
||||
escape <- ( word_boundary_esc
|
||||
/ non_word_boundary_esc
|
||||
/ control_esc
|
||||
/ digit_esc
|
||||
/ non_digit_esc
|
||||
/ form_feed_esc
|
||||
/ line_feed_esc
|
||||
/ carriage_return_esc
|
||||
/ white_space_esc
|
||||
/ non_white_space_esc
|
||||
/ tab_esc
|
||||
/ vertical_tab_esc
|
||||
/ word_esc
|
||||
/ non_word_esc
|
||||
/ back_reference
|
||||
/ octal_esc
|
||||
/ hex_esc
|
||||
/ unicode_esc
|
||||
/ null_esc
|
||||
/ literal_esc )
|
||||
literal <- [^|\\/.\[\(\)?+*$^]
|
||||
back_reference <- "\\" [1-9]
|
||||
word_boundary_esc <- "\\b"
|
||||
non_word_boundary_esc <- "\\B"
|
||||
backspace_esc <- "\\b"
|
||||
control_esc <- "\\b" .
|
||||
digit_esc <- "\\d"
|
||||
non_digit_esc <- "\\D"
|
||||
form_feed_esc <- "\\f"
|
||||
line_feed_esc <- "\\n"
|
||||
carriage_return_esc <- "\\r"
|
||||
white_space_esc <- "\\s"
|
||||
non_white_space_esc <- "\\S"
|
||||
tab_esc <- "\\t"
|
||||
vertical_tab_esc <- "\\v"
|
||||
word_esc <- "\\w"
|
||||
non_word_esc <- "\\W"
|
||||
octal_esc <- "\\0" [0-7]+
|
||||
hex_esc <- "\\x" [0-9a-fA-F] [0-9a-fA-F]
|
||||
unicode_esc <- "\\u" [0-9a-fA-F] [0-9a-fA-F] [0-9a-fA-F] [0-9a-fA-F]
|
||||
null_esc <- "\\0"
|
||||
literal_esc <- "\\" .
|
Loading…
Reference in New Issue
Block a user