]> sipb.mit.edu Git - ikiwiki.git/commitdiff
Merge commit 'smcv/atom'
authorJoey Hess <joey@gnu.kitenet.net>
Tue, 3 Feb 2009 20:04:36 +0000 (15:04 -0500)
committerJoey Hess <joey@gnu.kitenet.net>
Tue, 3 Feb 2009 20:04:36 +0000 (15:04 -0500)
doc/bugs/Aggregated_Atom_feeds_are_double-encoded.mdwn [new file with mode: 0644]
doc/sandbox.mdwn

diff --git a/doc/bugs/Aggregated_Atom_feeds_are_double-encoded.mdwn b/doc/bugs/Aggregated_Atom_feeds_are_double-encoded.mdwn
new file mode 100644 (file)
index 0000000..c2d9e17
--- /dev/null
@@ -0,0 +1,22 @@
+The Atom feed from <http://planet.collabora.co.uk/>
+get "double-encoded" (UTF-8 is decoded as Latin-1 and re-encoded as
+UTF-8) when aggregated with IkiWiki on Debian unstable. The RSS 1.0
+and RSS 2.0 feeds from the same Planet are fine. All three files
+are in fact correct UTF-8, but IkiWiki mis-parses the Atom.
+
+This turns out to be a bug in XML::Feed, or (depending on your point
+of view) XML::Feed failing to work around a design flaw in XML::Atom.
+When parsing RSS it returns Unicode strings, but when parsing Atom
+it delegates to XML::Atom's behaviour, which by default is to strip
+the UTF8 flag from strings that it outputs; as a result, they're
+interpreted by IkiWiki as byte sequences corresponding to the UTF-8
+encoding. IkiWiki then treats these as if they were Latin-1 and
+encodes them into UTF-8 for output.
+
+I've filed a bug against XML::Feed on CPAN requesting that it sets
+the right magical variable to change this behaviour. IkiWiki can
+also apply the same workaround (and doing so should be harmless even
+when XML::Feed is fixed); please consider merging my 'atom' branch,
+which does so. --[[smcv]]
+
+[[!tag patch]]
index a39264e18018b380d5bee9f70e2a3f1b04deaecc..f684a05867c81bf2e45881e098d404651cd08c33 100644 (file)
@@ -1,7 +1,7 @@
 This is the [[SandBox]], a page anyone can edit to try out ikiwiki (version [[!version  ]]).
 
 ----
-test
+test more test
 [[中文显示]]
 
 Here's a paragraph.