In addition to 2-byte and 3-byte UTF-8 sequences, correctly identify all
authorschwarze <schwarze@openbsd.org>
Sun, 27 Jun 2021 15:53:33 +0000 (15:53 +0000)
committerschwarze <schwarze@openbsd.org>
Sun, 27 Jun 2021 15:53:33 +0000 (15:53 +0000)
commit9704c0f800098b26a57eff001566d4fbde570bc8
tree53a6a13c0eecf9a287e6501b6fb655ee8583a590
parent657509d2d731d3185abdf7fff2bdc6708e95f67a
In addition to 2-byte and 3-byte UTF-8 sequences, correctly identify all
4-byte UTF-8 sequences and not just some of them, to keep them together
and avoid passing them on byte by byte, helping tools like tmux(1).

While here, also do all the range tests with < and > rather than &
for uniformity and readability, and add some comments.

Input and OK jca@ and nicm@.

Soeren at Soeren dash Tempel dot net originally reported the bug
and provided an incomplete patch that was used as a starting point,
and he also tested this final patch.
bin/ksh/emacs.c