https://www.tide-project.nl/blog/unicode