Support some escape sequences, in particular character escape sequences,
authorschwarze <schwarze@openbsd.org>
Mon, 23 Oct 2023 20:07:18 +0000 (20:07 +0000)
committerschwarze <schwarze@openbsd.org>
Mon, 23 Oct 2023 20:07:18 +0000 (20:07 +0000)
commit6d9b308dc5df90a03b34cba3ab639261f8094414
treebc4b379ce9121cc2f5913feb09a7f18e21ecbfbb
parent6c70526fad6dcfcac200cff20db0df29d187a15c
Support some escape sequences, in particular character escape sequences,
inside \w arguments, and skip most other escape sequences when measuring
the output length in this way because most escape sequences contribute
little or nothing to text width: for example, consider font escapes in
terminal output.

This implementation is very rudimentary.  In particular, it assumes that
every character has the same width.  No attempt is made to detect
double-width or zero-width Unicode characters or to take dependencies on
output devices or fonts into account.  These limitations are hard to
avoid because mandoc has to interpolate \w at the parsing stage when the
output device is not yet known.  I really do not want the content of the
syntax tree to depend on the output device.

Feature requested by Paul <Eggert at cs dot ucla dot edu>, who also
submitted a patch, but i chose to commit this very different patch
with almost the same functionality.
His input was still very valuable because complete support for \w is
out of the question, and consequently, the main task is identifying
subsets of the feature that are needed for real-world manual pages
and can be supported without uprooting the whole forest.
regress/usr.bin/mandoc/roff/esc/w.in
regress/usr.bin/mandoc/roff/esc/w.out_ascii
regress/usr.bin/mandoc/roff/esc/w.out_lint
share/man/man7/roff.7
usr.bin/mandoc/roff.c