<span class="Apple-style-span" style="font-family: arial, sans-serif; font-size: 13px; border-collapse: collapse; "><div><span class="Apple-style-span" style="font-family: arial, sans-serif; font-size: 13px; border-collapse: collapse; "><span class="Apple-style-span" style="border-collapse: separate; font-family: arial; font-size: small; ">Louis-David Mitterrand <span dir="ltr">&lt;<a href="mailto:vindex%2Blists-markdown-discuss@apartia.org">vindex+lists-markdown-discuss@apartia.org</a>&gt;</span> wrote:</span></span></div>
<div><span class="Apple-style-span" style="font-family: arial, sans-serif; font-size: 13px; border-collapse: collapse; "><br></span></div><blockquote class="gmail_quote" style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0.8ex; border-left-width: 1px; border-left-color: rgb(204, 204, 204); border-left-style: solid; padding-left: 1ex; ">
<font class="Apple-style-span" color="#666666">Should I save the raw unfiltered post to DB and then (1) expand markdown and (2) filter with StripScripts only when _displaying_ the post? That would entail keeping some potentially &quot;unclean&quot; posts in the DB and having to StripScripts them repeatedly.</font></blockquote>
</span><br><div class="gmail_quote">In my opinion the optimal solution is to save each post as is (i.e. as Markdown), convert the post to HTML when required, strip nasties, and <b>cache the result</b>. This is the approach I employ in <a href="http://mango.io/wtf?">Mango</a>, and it seems to work well.</div>
<div class="gmail_quote"><br></div><div class="gmail_quote">David</div><div class="gmail_quote"><br></div><div class="gmail_quote"><br></div><div class="gmail_quote">On 25 August 2010 00:49, Louis-David Mitterrand <span dir="ltr">&lt;<a href="mailto:vindex%2Blists-markdown-discuss@apartia.org">vindex+lists-markdown-discuss@apartia.org</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div class="im">On Tue, Aug 24, 2010 at 08:41:05AM -0400, Michel Fortin wrote:<br>
&gt; Le 2010-08-24 à 8:27, Louis-David Mitterrand a écrit :<br>
&gt;<br>
</div><div class="im">&gt; &gt; I&#39;m using perl&#39;s HTML::StripScripts to clean out unwanted/broken html<br>
&gt; &gt; from forum post on my web site but it also removes &lt;<a href="http://example.com" target="_blank">http://example.com</a>&gt;<br>
&gt; &gt; or &lt;<a href="mailto:user@example.com">user@example.com</a>&gt; markdown constructs.<br>
&gt; &gt;<br>
&gt; &gt; Any idea how to make these two live together in harmony?<br>
&gt;<br>
&gt; Are you calling StripScripts before or after Markdown? You should<br>
&gt; always filter tags after converting to HTML, as it seems StripScripts<br>
&gt; was designed to filter HTML, not Markdown-formatted text.<br>
&gt;<br>
&gt; Long explanation:<br>
&gt; &lt;<a href="http://michelf.com/weblog/2010/markdown-and-xss/" target="_blank">http://michelf.com/weblog/2010/markdown-and-xss/</a>&gt;<br>
<br>
</div>Actually I save the forum posts to the DB in non-converted markdown and<br>
filtered of any unwanted html.<br>
<br>
Should I save the raw unfiltered post to DB and then (1) expand markdown<br>
and (2) filter with StripScripts only when _displaying_ the post? That<br>
would entail keeping some potentially &quot;unclean&quot; posts in the DB and<br>
having to StripScripts them repeatedly.<br>
<font color="#888888"><br>
--<br>
<a href="http://www.cruisefish.net" target="_blank">http://www.cruisefish.net</a><br>
</font><div><div></div><div class="h5">_______________________________________________<br>
Markdown-Discuss mailing list<br>
<a href="mailto:Markdown-Discuss@six.pairlist.net">Markdown-Discuss@six.pairlist.net</a><br>
<a href="http://six.pairlist.net/mailman/listinfo/markdown-discuss" target="_blank">http://six.pairlist.net/mailman/listinfo/markdown-discuss</a><br>
</div></div></blockquote></div><br>