<HTML><FONT FACE=arial,helvetica><HTML><FONT COLOR="#000000" FACE="Lucida Grande" LANG="0" SIZE="4">john said:<BR>
&gt;&nbsp;&nbsp;  Have you considered using a PEG instead of regexes? <BR>
<BR>
for all you home-schooled and self-taught programmers<BR>
for whom "peg" is far too computer-sciencey for comfort,<BR>
consider as an alternative the simple methodology i use...<BR>
<BR>
i split the text-file on blank lines and place it in an array.<BR>
<BR>
that is first-cut for my light-markup format, a.k.a., "zml"<BR>
-- zen markup language -- but it's alright with me if you<BR>
markdown people want to borrow it for your own purpose.<BR>
<BR>
i mean, seriously, it's not like i could patent it, or anything.<BR>
(but, on second thought, perhaps i _should_ at least apply.)<BR>
<BR>
then i walk the array, analyzing each item to see what it is;<BR>
the chunk might get tagged as a blockquote, or a heading,<BR>
or a list item, or a plain old paragraph, or _whatever_ it is.<BR>
<BR>
then i walk the array again, using the tag for each chunk to<BR>
generate the appropriate output for the desired format(s)...<BR>
<BR>
(sometimes the tag, or the output, is dependent upon the<BR>
surrounding chunks, and that's the reason i walk it twice.)<BR>
<BR>
it's the methodology of a simpleton, i am the first to admit,<BR>
but it works, and it works well, and it works sufficiently fast.<BR>
<BR>
best of all, for me, is that it's extremely easy to understand.<BR>
<BR>
even better, for everyone:&nbsp;  it's easy for users to understand.<BR>
<BR>
after all, there's no payoff in confusing the users.&nbsp;  is there?<BR>
<BR>
-bowerbird<BR>
<BR>
p.s.&nbsp;  "alright" is a word i like to use...&nbsp;  it's akin to "already"...<BR>
</FONT><FONT COLOR="#000000" FACE="Lucida Grande" LANG="0" SIZE="4"></FONT></HTML>