]> sipb.mit.edu Git - ikiwiki.git/blobdiff - doc/todo/should_use_a_standard_encoding_for_utf_chars_in_filenames.mdwn
providing the .po file so that it can be included
[ikiwiki.git] / doc / todo / should_use_a_standard_encoding_for_utf_chars_in_filenames.mdwn
index ac82c94d2798697222afe5bdaaf437c735e7c504..5a55fcce5b8977612b3e3f360cf6a59dbc8179ba 100644 (file)
@@ -48,6 +48,11 @@ I hope it's a bug, not a feature and you fix it soon :) --[[Paweł|ptecza]]
 >>>>>> What's your locale? I have both pl\_PL (ISO-8859-2) and pl\_PL.UTF-8,
 >>>>>> but I use pl\_PL. Is it wrong? --[[Paweł|ptecza]]
 
+>>>>>>> IkiWiki assumes UTF-8 throughout, so escaped filename characters
+>>>>>>> should be `__x____y____z__` where x, y, z are the bytes of the
+>>>>>>> UTF-8 encoding of the character. I don't know how to achieve that
+>>>>>>> from a non-UTF-8 locale. --[[smcv]]
+
 >>>> Now, as to UTF7, in retrospect, using a standard encoding might be a
 >>>> better idea than coming up with my own encoding for filenames. Can 
 >>>> you provide a pointer to a description to modified-UTF7? --[[Joey]]
@@ -60,6 +65,10 @@ I hope it's a bug, not a feature and you fix it soon :) --[[Paweł|ptecza]]
 
 > Note: [libencode-imaputf7-perl][1] has made it into debian.
 >
+>> "IMAP UTF-7" uses & as an escape character, which seems like a recipe
+>> for shell injection vulnerabilities... so I would not recommend it
+>> for this particular use. --[[smcv]]
+
 > I would value some clarification, in the ikiwiki setup file I have
 >
 >     wiki_file_chars: -[:alnum:][\p{Arabic}()]+/.:_
@@ -79,5 +88,13 @@ I hope it's a bug, not a feature and you fix it soon :) --[[Paweł|ptecza]]
 >> Solving this sort of bug usually requires having a clear picture of
 >> which "strings" are bytestrings, and which "strings" are Unicode. --[[smcv]]
 
+>>> mhameed confirmed on IRC that anarcat's [[patch]] from
+>>> [[bugs/garbled_non-ascii_characters_in_body_in_web_interface]] fixes this.
+>>> --[[smcv]]
+
+>>>> Merged that patch. Not marking this page as done, because the todo
+>>>> about using a standard encoding still stands (although I'm not at
+>>>> all sure there's an encoding that would be better). --[[smcv]]
+
 [[wishlist]]
 [1]: https://packages.debian.org/search?suite=all&section=all&arch=any&searchon=names&keywords=libencode-imaputf7-perl