<div dir="ltr"><div class="gmail_default" style="font-family:&#39;times new roman&#39;,serif;font-size:large;color:rgb(56,118,29)">Bowerbird, after this epistle, I promise to read you more thoroughly.  Nicely put.</div><div class="gmail_default" style="font-family:&#39;times new roman&#39;,serif;font-size:large;color:rgb(56,118,29)">

<br></div><div class="gmail_default" style="font-family:&#39;times new roman&#39;,serif;font-size:large;color:rgb(56,118,29)"><br></div></div><div class="gmail_extra"><br clear="all"><div>Respectfully,<br><br>Sherwood of Sherwood&#39;s Forests<br>

<br>Sherwood Botsford<br>Sherwood&#39;s Forests --  <a href="http://Sherwoods-Forests.com" target="_blank">http://Sherwoods-Forests.com</a><br>780-848-2548<br>50042 Range Rd 31<br>Warburg, Alberta T0C 2T0<br><br></div>
<br><br><div class="gmail_quote">On 7 July 2013 20:21, bowerbird <span dir="ltr">&lt;<a href="mailto:bowerbird@aol.com" target="_blank">bowerbird@aol.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

first, i&#39;m sorry for the expletive in your in-box.  really.<br>
<br>
i also apologize for the smell from those dead skunks.<br>
<br>
***<br>
<br>
as to &quot;what this has to do with markdown&quot;, it&#39;s simple.<br>
<br>
if i remember correctly -- i might not, but who cares? --<br>
&quot;fan_f*ck*ng_tastic&quot; was the word gruber used to justify<br>
his choice that his version of markdown would recognize<br>
intraword italics.  so that&#39;s why _i_ used that one as well.<br>
<br>
now, the reason i followed it up with my reference to the<br>
dead-skunk problem is because it&#39;s almost perfect as a<br>
demonstration of the full range of problems these days...<br>
<br>
a person comes in and says, &quot;hey, i noticed this glitch&quot;.<br>
<br>
somebody else says &quot;here&#39;s a workaround you can use.&quot;<br>
<br>
which -- first -- ignores the fact that it&#39;s after-the-fact.<br>
<br>
but, in this particular case, the suggestion was actually<br>
better than most.  to remind you, the workaround was to<br>
surround filename_withanunderbar.txt with `backticks`,<br>
which marks it as `code`, and thus short-circuits italics.<br>
<br>
because, as the suggester pointed out, it is the case that<br>
you probably _want_ filenames to be marked as `code`,<br>
so they will display in a different typeface, and stand out.<br>
<br>
the problem with that tactic, however, is that it does not<br>
address the situation where you would want the word to<br>
be rendered with the same typeface as surrounding text.<br>
you wouldn&#39;t want &quot;fan_f*ck*ng_tastic&quot; marked as code.<br>
<br>
so...  sticking with the problem in regard to filenames...<br>
<br>
another workaround would be to backslash/escape the<br>
underbar in the filename, which will also nix the italics,<br>
but that presents a different problem, which is that now<br>
we&#39;ve gummed up the plain-text version of the filename<br>
with an unwanted backslash, with unknown side-effects.<br>
(since you just know somebody is going to end up using<br>
that now-improper filename, and they will suffer for it.)<br>
<br>
that same type of problem would likely manifest with the<br>
&quot;just use raw .html&quot; workaround, even if you can find the<br>
way to concoct that.  (it hurts my brain to think about it;<br>
i&#39;m using light-markup so i&#39;m not forced to do raw html.)<br>
<br>
the fact is, we really want to leave a filename untouched.<br>
but we also don&#39;t want its underbars to be italic triggers.<br>
<br>
and remember that when an underbar is misrecognized<br>
as an italic-trigger, it&#39;s dropped from .html output, so<br>
we now have _another_ wrong version of that filename,<br>
in addition to the difficult problem of the runaway italics.<br>
<br>
and, just to remind y&#39;all that this is even _more_ thorny,<br>
this underbar problem also happens regularly with urls.<br>
<br>
(there are other instances too, but i do not intend to<br>
share all of the results from my hard-fought research;<br>
since url&#39;s have the problem, it is significant enough.)<br>
<br>
this is not a thing we can casually sweep under the rug.<br>
<br>
which is why some markdown script-writers have just<br>
decided that they will _disallow_ intraword underbars.<br>
<br>
and, in defense of that decision, it is the absolute truth<br>
that browsers make a sad tragedy with intraword italics.<br>
go look at some, take a hard look, and you _will_ see it:<br>
the italic characters either slant into the upright ones, or<br>
lean far too far away from them. either side, it&#39;s _awful_.<br>
<br>
so yes, many markdown scripters do an outright ban...<br>
<br>
which is fine if you are god, and you make the decisions.<br>
<br>
but if you are beholden to users, it might not be so good.<br>
<br>
and if you consider yourself to be a _servant_of_writers_,<br>
then you really need to do a bit of research (or lots of it)<br>
to discern if writers actually do ever use intraword italics.<br>
<br>
that was what i did, as i was developing my light-markup.<br>
<br>
so i can tell you that, yes, indeed, writers _do_ use them.<br>
<br>
not a lot, of course, but they&#39;re not that infrequent either,<br>
and it is a sizable percentage of writers that do use them.<br>
<br>
so that&#39;s probably why about _half_ of the implementations<br>
ban &#39;em, and half _allow_ them.  it&#39;s split down the middle.<br>
<br>
so if you really want to know if it&#39;s acceptable to ban them,<br>
my advice would be &quot;no&quot;.<br>
<br>
***<br>
<br>
now, let&#39;s go back and look what the original poster said.<br>
<br>
&gt;   Why not to ignore all &quot;_&quot;<br>
&gt;   which are not followed or preceded<br>
&gt;   either by a whitespace or by a newline?<br>
<br>
just for the record, a newline _is_ whitespace, so we can<br>
strike the &quot;or by a newline&quot; phrase; just use &quot;whitespace&quot;.<br>
<br>
as a first pass in thinking about that issue, that&#39;s not bad.<br>
i&#39;d say it&#39;s the &quot;solution&quot; most people would come up with.<br>
<br>
i wouldn&#39;t even be surprised if some implementations do<br>
indeed use exactly that rule to govern their conversions...<br>
<br>
but if you actually go look at where italics markup is used,<br>
you&#39;ll find many people put italics _inside_ any punctuation.<br>
(most typically, you can find this with double-quote marks,<br>
but any terminal-punctuation will present the same issue.)<br>
<br>
now i wouldn&#39;t recommend that, because -- as i just said --<br>
browsers do a lousy job when italics are next to un-italics,<br>
and that&#39;s true for punctuation as much as other characters.<br>
<br>
but the fact remains that a lot of people use italics like that,<br>
so if you use &quot;whitespace&quot; as the rule, you&#39;ll screw them up.<br>
<br>
(of course, by putting your underbars _outside_ quotemarks,<br>
you can screw up some conversion routines for curly-quotes,<br>
because _they_ are using whitespace to make their decisions;<br>
but that&#39;s why you need to decide things in a systematic way.)<br>
<br>
again, back to the original poster:<br>
<br>
&gt;   It would be nice to make<br>
&gt;   a part of the official Markdown definition<br>
&gt;   then all implementation will display this in the same way.<br>
<br>
as gruber put it, years ago and very recently, people _say_<br>
they wanna have an &quot;official&quot; version of markdown -- but<br>
what they _mean_ is that they want _their_ pet desires to<br>
receive his stamp of approval as &quot;the official markdown&quot;.<br>
<br>
but if gruber _were_ to make an &quot;official version&quot;, he says<br>
that it would make those people very unhappy, because he<br>
will instantiate _his_ pet desires as the canonical standard.<br>
<br>
so, let me say to the original poster, gruber _did_ make the<br>
closest thing to an official version, and it specifically _allows_<br>
intraword italics.  so you wouldn&#39;t get what you want anyway.<br>
<br>
which is not to say that other implementations, which do it<br>
_differently_ are &quot;wrong&quot;, because gruber likes it &quot;flexible&quot;.<br>
<br>
in other words, he doesn&#39;t _want_ all implementations to<br>
&quot;display in the same way&quot;.  which could be well and good,<br>
if not for all these dead skunks in the middle of the road.<br>
<br>
you can call it &quot;flexiblity&quot;, or you can call it &quot;inconsistencies&quot;.<br>
<br>
whether you, or i, or anyone else for that matter, considers<br>
all this to be &quot;right&quot; or &quot;wrong&quot; is entirely beside the point...<br>
<br>
since gruber ain&#39;t gonna change his ways, and neither are<br>
the many developers, whose stubborn insistence has also<br>
been equally-well documented, there is no resolution here.<br>
<br>
which is why most people have stopped thinking long ago.<br>
<br>
***<br>
<br>
and _that_, my friends, is another one of the problems here.<br>
<br>
because that refusal to do any more thinking on the matters<br>
-- the disinclination to remove dead skunks from the road --<br>
means that the situation really has become totally hopeless.<br>
<br>
as fletcher put it, in his reply to the original poster:<br>
<br>
&gt;   Stick around.  You&#39;ll learn.   ;)<br>
<br>
hey, at least he put a winkey-smiley after it...   ;+)<br>
<br>
***<br>
<br>
so, just to do a follow-through as a for-example for you,<br>
let me run you through the thinking that i did when i was<br>
working about the aspects of this intraword italics issue.<br>
<br>
one part, which i mentioned above, was to survey books<br>
-- as my system focuses on books -- to see if authors<br>
actually use intraword italics.  and they occasionally do.<br>
<br>
on the other hand, more research revealed quite readily<br>
that there was a problem with both filenames and urls,<br>
as they often contain underbars.  (and, so i note it, yes,<br>
a url _is_ a filename, but sometimes it&#39;s a symbolic one<br>
-- in the sense that the &quot;file&quot; does not actually exist --<br>
so both for purposes of clarity and to remind us of the<br>
full range of the problem, i mention them specifically.)<br>
<br>
so, both use-cases do exist.  we have intraword italics,<br>
and intraword underbars that must be taken as literals.<br>
<br>
thus, we need a way to differentiate them.<br>
<br>
the key here, to which i have already given one big hint,<br>
is that the literal-underbars occur in specific situations,<br>
namely for filenames and urls.  intraword italics, on the<br>
other hand, occur (by definition) in the middle of words.<br>
<br>
so when my system encounters an underbar in a string,<br>
it decides whether the string is a filename/url or a word.<br>
in the former, the underbar is seen as a literal character;<br>
in the latter, the underbar is considered an italic trigger.<br>
<br>
it&#39;s relatively simple to determine if something is a url;<br>
e.g., an &quot;http&quot; or a &quot;www&quot; or a &quot;.com&quot; is a dead giveway.<br>
and an internal period is a good indicator of a filename,<br>
especially if it&#39;s followed by a known filename extension.<br>
<br>
likewise, it&#39;s relatively easy to tell if something is a word,<br>
or is not, once you have removed the underbars inside it.<br>
if it&#39;s in the dictionary, or if it&#39;s repeated (sans underbars)<br>
elsewhere in the document, odds are that the underbars<br>
in this version of the string are intended as italic triggers.<br>
<br>
so, in my testing, this decision-rule has been pretty solid.<br>
<br>
it&#39;s not something that i would recommend for markdown,<br>
because of factors i will discuss later, but it works for me.<br>
<br>
and, more to the point i&#39;m trying to make here, it&#39;s what<br>
can happen if you really try hard to resolve a discrepancy,<br>
rather than simply just throwing your hands up in the air.<br>
(like you just don&#39;t care. hu-hum, hu-hum, baby-cakes.)<br>
<br>
i mean, i understand the paralysis that _will_ result when<br>
you&#39;re mired in a standoff situation, like this has become,<br>
but i think you markdown developers need to fight that.<br>
instead, you&#39;ve all let yourself become complacent about<br>
the edge-cases and inconsistencies that dog the format.<br>
<br>
a little elbow-grease might go a long way, is what i say.<br>
<br>
but you&#39;re going to have to apply it.  i had to work a lot<br>
to come to the easy understanding of intraword italics<br>
that i have just imparted to you.  you need to work too.<br>
<br>
and, for me, the italics situation was actually less sticky<br>
than the asterisk problem, because asterisk-overload is<br>
much, much worse.  asterisks -- which i use for *bold*<br>
(and i didn&#39;t take the easy way out and require two) --<br>
_also_ represent bullets in unordered lists, _and_ occur<br>
in equations where they are the sign for multiplication.<br>
writing the routines to sort through all that was a pain.<br>
<br>
further, curly-quote conversion isn&#39;t as easy as it seems.<br>
a single round of thinking (like microsoft did) will create<br>
a converter that makes some very embarassing mistakes.<br>
<br>
even a couple more rounds of thinking might not give<br>
you a routine that correctly gives straight-quotes in the<br>
cases where the marks are referring to feet and inches,<br>
or the minutes-and-seconds part of lattitude/longitude.<br>
<br>
again, this is the kind of intense thinking you have to do<br>
if you wanna sort through these types of difficulties, but<br>
nobody here that i can see is doing much thinking at all.<br>
and for sure you don&#39;t share any thinking you are doing,<br>
or bounce ideas off of each other in a collaborative way.<br>
<br>
and that&#39;s really sad.<br>
<br>
***<br>
<br>
so, anyway, this is what i&#39;d recommend for markdown,<br>
as your general solution to the underbar/italic problem.<br>
<br>
(and, yes, i am chuckling as i write this, because i know<br>
darn well that nobody even wants &quot;a general solution&quot;,<br>
and even though some implementations already do it,<br>
the rest -- including gruber -- will never, ever, follow,<br>
so any such proposal is an exercise in mere folly, but...)<br>
<br>
anyway, here it is:<br>
<br>
ban intraword italics, outright, with full notice, _but_<br>
make it clear that the workaround is to use raw .html<br>
to obtain the necessary italics for any intraword needs.<br>
<br>
(and if you&#39;re curious why i don&#39;t use this in my system,<br>
the reason is because i do not permit raw .html at all.)<br>
<br>
***<br>
<br>
and, finally, hey, let&#39;s put this all into perspective, ok?<br>
<br>
the kind of standoff we have here is relatively minor.<br>
and the problems we see border on the most trivial...<br>
<br>
we see the same type of stubborness at a larger level<br>
as the big corporations continue lobbying for d.r.m.,<br>
and the big tech companies up their lock-in tactics.<br>
<br>
and unlike here, in little old markdown land, where<br>
there is no money to be made one way or the other,<br>
the dollars from d.r.m. and lock-in could be _huge_.<br>
so those companies are gonna be firm, intransigent,<br>
and persistent in their stubbornness and their greed.<br>
<br>
and, on a bigger level still, look at global warming,<br>
and the way that we are rapidly polluting our planet.<br>
<br>
again, the standoff there is so much more dangerous,<br>
as the money is _staggering_, so don&#39;t even bother to<br>
wonder if any of the big corporations will ever change.<br>
<br>
and once humans go extinct, it will not really matter if,<br>
once upon a time, somewhere along the line, someone<br>
had their italics messed up because of a stray underbar.<br>
<br>
so, just so you know, if it was _just_ markdown that this<br>
was relevant to, i probably wouldn&#39;t care nearly so much.<br>
<br>
but the problem of stubborn standoffs is much bigger,<br>
and applies to arenas far larger than this little molehill,<br>
causing problems worse than the smell of dead skunks,<br>
and _that_ is why i care, and why i choose to speak up...<br>
<br>
now i will ask you: why do you sit and suffer in silence?<br>
<br>
-bowerbird<br>
<br>
_______________________________________________<br>
Markdown-Discuss mailing list<br>
<a href="mailto:Markdown-Discuss@six.pairlist.net">Markdown-Discuss@six.pairlist.net</a><br>
<a href="http://six.pairlist.net/mailman/listinfo/markdown-discuss" target="_blank">http://six.pairlist.net/mailman/listinfo/markdown-discuss</a><br>
</blockquote></div><br></div>