PHP Classes

File: src/voku/helper/data/ascii_by_languages.php

Recommend this page to a friend!
  Classes of Lars Moelleken   portable ascii   src/voku/helper/data/ascii_by_languages.php   Download  
File: src/voku/helper/data/ascii_by_languages.php
Role: Auxiliary script
Content type: text/plain
Description: Auxiliary script
Class: portable ascii
Manipulate text strings without special extensions
Author: By
Last change:
Date: 4 years ago
Size: 28,714 bytes
 

Contents

Class file image Download
<?php return [ // Greek 'el' => [ '?' => 'a', '?' => 'b', '?' => 'g', '?' => 'd', '?' => 'e', '?' => 'z', '?' => 'h', '?' => '8', '?' => 'i', '?' => 'k', '?' => 'l', '?' => 'm', '?' => 'n', '?' => '3', '?' => 'o', '?' => 'p', '?' => 'r', '?' => 's', '?' => 't', '?' => 'y', '?' => 'f', '?' => 'x', '?' => 'ps', '?' => 'w', '?' => 'a', '?' => 'e', '?' => 'i', '?' => 'o', '?' => 'y', '?' => 'h', '?' => 'w', '?' => 's', '?' => 'i', '?' => 'y', '?' => 'y', '?' => 'i', '?' => 'A', '?' => 'B', '?' => 'G', '?' => 'D', '?' => 'E', '?' => 'Z', '?' => 'H', '?' => '8', '?' => 'I', '?' => 'K', '?' => 'L', '?' => 'M', '?' => 'N', '?' => '3', '?' => 'O', '?' => 'P', '?' => 'R', '?' => 'S', '?' => 'T', '?' => 'Y', '?' => 'F', '?' => 'X', '?' => 'PS', '?' => 'W', '?' => 'A', '?' => 'E', '?' => 'I', '?' => 'O', '?' => 'Y', '?' => 'H', '?' => 'W', '?' => 'I', '?' => 'Y', '??' => 'AU', '??' => 'Au', '??' => 'OU', '??' => 'Ou', '??' => 'EU', '??' => 'Eu', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'AU', '??' => 'Au', '??' => 'OU', '??' => 'Ou', '??' => 'EU', '??' => 'Eu', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'I', '??' => 'au', '??' => 'ou', '??' => 'eu', '??' => 'i', '??' => 'i', '??' => 'i', '??' => 'au', '??' => 'ou', '??' => 'eu', '??' => 'i', '??' => 'i', '??' => 'i', '??' => 'i', '?' => 'v', '?' => 'th', ], // Hindi 'hi' => [ '?' => 'a', '?' => 'aa', '?' => 'e', '?' => 'ii', '?' => 'ei', '?' => 'ae', '?' => 'ai', '?' => 'i', '?' => 'o', '?' => 'oi', '?' => 'oii', '?' => 'uu', '?' => 'ou', '?' => 'u', '?' => 'B', '?' => 'Bha', '?' => 'Ca', '?' => 'Chha', '?' => 'Da', '?' => 'Dha', '?' => 'Fa', '??' => 'Fi', '?' => 'Ga', '?' => 'Gha', '??' => 'Ghi', '?' => 'Ha', '?' => 'Ja', '?' => 'Jha', '?' => 'Ka', '?' => 'Kha', '??' => 'Khi', '?' => 'L', '?' => 'Li', '?' => 'Li', '?' => 'Lii', '?' => 'Lii', '?' => 'Ma', '?' => 'Na', '?' => 'Na', '?' => 'Nia', '?' => 'Nae', '?' => 'Ni', '?' => 'oms', '?' => 'Pa', '??' => 'Qi', '?' => 'Ra', '?' => 'Ri', '?' => 'Ri', '?' => 'Ri', '?' => 'Sa', '?' => 'Sha', '?' => 'Shha', '?' => 'Ta', '?' => 'Ta', '?' => 'Tha', '?' => 'Tha', '?' => 'Tha', '?' => 'Thha', '??' => 'ugDha', '??' => 'ugDhha', '?' => 'Va', '?' => 'Ya', '??' => 'Yi', '??' => 'Za', ], // Swedish 'sv' => [ 'Ä' => 'A', 'Å' => 'a', 'Ö' => 'O', 'ä' => 'a', 'å' => 'a', 'ö' => 'o', ], // Turkish 'tr' => [ '?' => 's', '?' => 'S', '?' => 'i', '?' => 'I', 'ç' => 'c', 'Ç' => 'C', 'ü' => 'u', 'Ü' => 'U', 'ö' => 'o', 'Ö' => 'O', '?' => 'g', '?' => 'G', ], // Bulgarian 'bg' => [ '?' => 'Sht', '?' => 'Sh', '?' => 'Ch', '?' => 'C', '?' => 'Yu', '?' => 'Ya', '?' => 'J', '?' => 'A', '?' => 'B', '?' => 'V', '?' => 'G', '?' => 'D', '?' => 'E', '?' => 'Z', '?' => 'I', '?' => 'Y', '?' => 'K', '?' => 'L', '?' => 'M', '?' => 'N', '?' => 'O', '?' => 'P', '?' => 'R', '?' => 'S', '?' => 'T', '?' => 'U', '?' => 'F', '?' => 'H', '?' => '', '?' => 'A', '?' => 'sht', '?' => 'sh', '?' => 'ch', '?' => 'c', '?' => 'yu', '?' => 'ya', '?' => 'j', '?' => 'a', '?' => 'b', '?' => 'v', '?' => 'g', '?' => 'd', '?' => 'e', '?' => 'z', '?' => 'i', '?' => 'y', '?' => 'k', '?' => 'l', '?' => 'm', '?' => 'n', '?' => 'o', '?' => 'p', '?' => 'r', '?' => 's', '?' => 't', '?' => 'u', '?' => 'f', '?' => 'h', '?' => '', '?' => 'a', '??' => 'ia', '??' => 'i?', '??' => 'io', ], // Hungarian 'hu' => [ 'Á' => 'A', '?' => 'E', 'Í' => 'I', 'Ó' => 'O', 'Ö' => 'O', '?' => 'O', 'Ú' => 'U', 'Ü' => 'U', '?' => 'U', 'á' => 'a', 'é' => 'e', 'í' => 'i', 'ó' => 'o', 'ö' => 'o', '?' => 'o', 'ú' => 'u', 'ü' => 'u', '?' => 'u', ], // Burmese 'by' => [ '?' => 'k', '?' => 'kh', '?' => 'g', '?' => 'ga', '?' => 'ng', '?' => 's', '?' => 'sa', '?' => 'z', '??' => 'za', '?' => 'ny', '?' => 't', '?' => 'ta', '?' => 'd', '?' => 'da', '?' => 'na', '?' => 't', '?' => 'ta', '?' => 'd', '?' => 'da', '?' => 'n', '?' => 'p', '?' => 'pa', '?' => 'b', '?' => 'ba', '?' => 'm', '?' => 'y', '?' => 'ya', '?' => 'l', '?' => 'w', '?' => 'th', '?' => 'h', '?' => 'la', '?' => 'a', '?' => 'y', '?' => 'ya', '?' => 'w', '??' => 'yw', '??' => 'ywa', '?' => 'h', '?' => 'e', '?' => '-e', '?' => 'i', '?' => '-i', '?' => 'u', '?' => '-u', '?' => 'aw', '????' => 'aw', '?' => 'aw', '?' => 'ywae', '?' => 'hnaik', '?' => '0', '?' => '1', '?' => '2', '?' => '3', '?' => '4', '?' => '5', '?' => '6', '?' => '7', '?' => '8', '?' => '9', '?' => '', '?' => '', '?' => '', '?' => 'a', '?' => 'a', '?' => 'e', '?' => 'e', '?' => 'i', '?' => 'i', '??' => 'o', '?' => 'u', '?' => 'u', '????' => 'aung', '??' => 'aw', '???' => 'aw', '??' => 'aw', '???' => 'aw', '?' => 'at', '??' => 'et', '????' => 'aik', '????' => 'auk', '??' => 'in', '????' => 'aing', '????' => 'aung', '??' => 'it', '??' => 'i', '??' => 'at', '???' => 'eik', '???' => 'ok', '???' => 'ut', '???' => 'it', '??' => 'd', '????' => 'ok', '???' => 'ait', '??' => 'an', '???' => 'an', '???' => 'ein', '???' => 'on', '???' => 'un', '??' => 'at', '???' => 'eik', '???' => 'ok', '???' => 'ut', '?????' => 'nub', '??' => 'an', '???' => 'ein', '???' => 'on', '???' => 'un', '??' => 'e', '????' => 'ol', '??' => 'in', '?' => 'an', '??' => 'ein', '??' => 'on', ], // Croatian 'hr' => [ '?' => 'C', '?' => 'C', '?' => 'Z', '?' => 'S', '?' => 'Dj', '?' => 'c', '?' => 'c', '?' => 'z', '?' => 's', '?' => 'dj', ], // Finnish 'fi' => [ 'Ä' => 'A', 'Ö' => 'O', 'ä' => 'a', 'ö' => 'o', ], // Georgian 'ka' => [ '?' => 'a', '?' => 'b', '?' => 'g', '?' => 'd', '?' => 'e', '?' => 'v', '?' => 'z', '?' => 't', '?' => 'i', '?' => 'k', '?' => 'l', '?' => 'm', '?' => 'n', '?' => 'o', '?' => 'p', '?' => 'zh', '?' => 'r', '?' => 's', '?' => 't', '?' => 'u', '?' => 'f', '?' => 'k', '?' => 'gh', '?' => 'q', '?' => 'sh', '?' => 'ch', '?' => 'ts', '?' => 'dz', '?' => 'ts', '?' => 'ch', '?' => 'kh', '?' => 'j', '?' => 'h', ], // Russian 'ru' => [ '?' => 'a', '?' => 'b', '?' => 'v', '?' => 'g', '?' => 'd', '?' => 'e', '?' => 'yo', '?' => 'zh', '?' => 'z', '?' => 'i', '?' => 'i', '?' => 'k', '?' => 'l', '?' => 'm', '?' => 'n', '?' => 'o', '?' => 'p', '?' => 'r', '?' => 's', '?' => 't', '?' => 'u', '?' => 'f', '?' => 'h', '?' => 'c', '?' => 'ch', '?' => 'sh', '?' => 'sh', '?' => '', '?' => 'y', '?' => '', '?' => 'e', '?' => 'yu', '?' => 'ya', '?' => 'A', '?' => 'B', '?' => 'V', '?' => 'G', '?' => 'D', '?' => 'E', '?' => 'Yo', '?' => 'Zh', '?' => 'Z', '?' => 'I', '?' => 'I', '?' => 'K', '?' => 'L', '?' => 'M', '?' => 'N', '?' => 'O', '?' => 'P', '?' => 'R', '?' => 'S', '?' => 'T', '?' => 'U', '?' => 'F', '?' => 'H', '?' => 'C', '?' => 'Ch', '?' => 'Sh', '?' => 'Sh', '?' => '', '?' => 'Y', '?' => '', '?' => 'E', '?' => 'Yu', '?' => 'Ya', '?' => '', ], // Ukrainian 'uk' => [ '?' => 'Ye', '?' => 'I', '?' => 'Yi', '?' => 'G', '?' => 'ye', '?' => 'i', '?' => 'yi', '?' => 'g', ], // Kazakh 'kk' => [ '?' => 'A', '?' => 'G', '?' => 'Q', '?' => 'N', '?' => 'O', '?' => 'U', '?' => 'U', '?' => 'H', '?' => 'a', '?' => 'g', '?' => 'q', '?' => 'n', '?' => 'o', '?' => 'u', '?' => 'u', '?' => 'h', ], // Czech 'cs' => [ '?' => 'c', '?' => 'd', '?' => 'e', '?' => 'n', '?' => 'r', '?' => 's', '?' => 't', '?' => 'u', '?' => 'z', '?' => 'C', '?' => 'D', '?' => 'E', '?' => 'N', '?' => 'R', '?' => 'S', '?' => 'T', '?' => 'U', '?' => 'Z', ], // Danish 'da' => [ 'Æ' => 'Ae', 'æ' => 'ae', 'Ø' => 'Oe', 'ø' => 'oe', 'Å' => 'Aa', 'å' => 'aa', 'É' => 'E', 'é' => 'e', ], // Polish 'pl' => [ '?' => 'a', '?' => 'c', '?' => 'e', '?' => 'l', '?' => 'n', 'ó' => 'o', '?' => 's', '?' => 'z', '?' => 'z', '?' => 'A', '?' => 'C', '?' => 'e', '?' => 'L', '?' => 'N', 'Ó' => 'O', '?' => 'S', '?' => 'Z', '?' => 'Z', ], // Romanian 'ro' => [ '?' => 'a', 'â' => 'a', '?' => 'A', 'Â' => 'A', 'î' => 'i', 'Î' => 'I', '?' => 's', '?' => 's', '?' => 'S', '?' => 'S', '?' => 't', '?' => 't', '?' => 'T', '?' => 'T', ], // Esperanto 'eo' => [ '?' => 'cx', '?' => 'gx', '?' => 'hx', '?' => 'jx', '?' => 'sx', '?' => 'ux', '?' => 'CX', '?' => 'GX', '?' => 'HX', '?' => 'JX', '?' => 'SX', '?' => 'UX', ], // Estonian 'et' => [ '?' => 'S', '?' => 'Z', 'Õ' => 'O', 'Ä' => 'A', 'Ö' => 'O', 'Ü' => 'U', '?' => 's', '?' => 'z', 'õ' => 'o', 'ä' => 'a', 'ö' => 'o', 'ü' => 'u', ], // Latvian 'lv' => [ '?' => 'a', '?' => 'c', '?' => 'e', '?' => 'g', '?' => 'i', '?' => 'k', '?' => 'l', '?' => 'n', '?' => 's', '?' => 'u', '?' => 'z', '?' => 'A', '?' => 'C', '?' => 'E', '?' => 'G', '?' => 'i', '?' => 'k', '?' => 'L', '?' => 'N', '?' => 'S', '?' => 'u', '?' => 'Z', ], // Lithuanian 'lt' => [ '?' => 'a', '?' => 'c', '?' => 'e', '?' => 'e', '?' => 'i', '?' => 's', '?' => 'u', '?' => 'u', '?' => 'z', '?' => 'A', '?' => 'C', '?' => 'E', '?' => 'E', '?' => 'I', '?' => 'S', '?' => 'U', '?' => 'U', '?' => 'Z', ], // Norwegian 'no' => [ 'Æ' => 'AE', 'Ø' => 'OE', 'Å' => 'AA', 'æ' => 'ae', 'ø' => 'oe', 'å' => 'aa', ], // Vietnamese 'vi' => [ 'Á' => 'A', 'À' => 'A', '?' => 'A', 'Ã' => 'A', '?' => 'A', '?' => 'A', '?' => 'A', '?' => 'A', '?' => 'A', '?' => 'A', '?' => 'A', 'Â' => 'A', '?' => 'A', '?' => 'A', '?' => 'A', '?' => 'A', '?' => 'A', 'á' => 'a', 'à' => 'a', '?' => 'a', 'ã' => 'a', '?' => 'a', '?' => 'a', '?' => 'a', '?' => 'a', '?' => 'a', '?' => 'a', '?' => 'a', 'â' => 'a', '?' => 'a', '?' => 'a', '?' => 'a', '?' => 'a', '?' => 'a', 'É' => 'E', 'È' => 'E', '?' => 'E', '?' => 'E', '?' => 'E', 'Ê' => 'E', '?' => 'E', '?' => 'E', '?' => 'E', '?' => 'E', '?' => 'E', 'é' => 'e', 'è' => 'e', '?' => 'e', '?' => 'e', '?' => 'e', 'ê' => 'e', '?' => 'e', '?' => 'e', '?' => 'e', '?' => 'e', '?' => 'e', 'Í' => 'I', 'Ì' => 'I', '?' => 'I', '?' => 'I', '?' => 'I', 'í' => 'i', 'ì' => 'i', '?' => 'i', '?' => 'i', '?' => 'i', 'Ó' => 'O', 'Ò' => 'O', '?' => 'O', 'Õ' => 'O', '?' => 'O', 'Ô' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', 'ó' => 'o', 'ò' => 'o', '?' => 'o', 'õ' => 'o', '?' => 'o', 'ô' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', 'Ú' => 'U', 'Ù' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', 'ú' => 'u', 'ù' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', 'Ý' => 'Y', '?' => 'Y', '?' => 'Y', '?' => 'Y', '?' => 'Y', 'ý' => 'y', '?' => 'y', '?' => 'y', '?' => 'y', '?' => 'y', '?' => 'D', '?' => 'd', ], // Arabic 'ar' => [ '?' => 'a', '?' => 'b', '?' => 't', '?' => 'th', '?' => 'g', '?' => 'h', '?' => 'kh', '?' => 'd', '?' => 'th', '?' => 'r', '?' => 'z', '?' => 's', '?' => 'sh', '?' => 's', '?' => 'd', '?' => 't', '?' => 'th', '?' => 'aa', '?' => 'gh', '?' => 'f', '?' => 'k', '?' => 'k', '?' => 'l', '?' => 'm', '?' => 'n', '?' => 'h', '?' => 'o', '?' => 'y', '?' => 'a', '?' => 'a', '?' => 'a', '?' => 'o', '?' => 'y', '?' => 'aa', '?' => '0', '?' => '1', '?' => '2', '?' => '3', '?' => '4', '?' => '5', '?' => '6', '?' => '7', '?' => '8', '?' => '9', ], // Persian 'fa' => [ '?' => 'g', '?' => 'j', '?' => 'p', '?' => 'ch', '?' => 'y', '?' => 'k', '?' => '0', '?' => '1', '?' => '2', '?' => '3', '?' => '4', '?' => '5', '?' => '6', '?' => '7', '?' => '8', '?' => '9', ], // Serbian 'sr' => [ '?' => 'j', '?' => 'lj', '?' => 'nj', '?' => 'c', '?' => 'dz', '?' => 'j', '?' => 'Lj', '?' => 'Nj', '?' => 'C', '?' => 'Dz', '?' => 'Dj', 'Ð' => 'Dj', 'ð' => 'dj', '?' => 'dj', '?' => 'dj', '?' => 'Dj', '?' => 'a', '?' => 'b', '?' => 'v', '?' => 'g', '?' => 'd', '?' => 'e', '?' => 'z', '?' => 'z', '?' => 'i', '?' => 'k', '?' => 'l', '?' => 'm', '?' => 'n', '?' => 'o', '?' => 'p', '?' => 'r', '?' => 's', '?' => 't', '?' => 'u', '?' => 'f', '?' => 'h', '?' => 'c', '?' => 'c', '?' => 's', '?' => 'A', '?' => 'B', '?' => 'V', '?' => 'G', '?' => 'D', '?' => 'E', '?' => 'Z', '?' => 'Z', '?' => 'I', '?' => 'K', '?' => 'L', '?' => 'M', '?' => 'N', '?' => 'O', '?' => 'P', '?' => 'R', '?' => 'S', '?' => 'T', '?' => 'U', '?' => 'F', '?' => 'H', '?' => 'C', '?' => 'C', '?' => 'S', '?' => 's', '?' => 'z', '?' => 'c', '?' => 'c', '?' => 'S', '?' => 'Z', '?' => 'C', '?' => 'C', ], // Azerbaijani 'az' => [ 'ç' => 'c', '?' => 'e', '?' => 'g', '?' => 'i', 'ö' => 'o', '?' => 's', 'ü' => 'u', 'Ç' => 'C', '?' => 'E', '?' => 'G', '?' => 'I', 'Ö' => 'O', '?' => 'S', 'Ü' => 'U', ], // Slovak 'sk' => [ 'á' => 'a', 'ä' => 'a', '?' => 'c', '?' => 'd', 'é' => 'e', 'í' => 'i', '?' => 'l', '?' => 'l', '?' => 'n', 'ó' => 'o', 'ô' => 'o', '?' => 'r', '?' => 's', '?' => 't', 'ú' => 'u', 'ý' => 'y', '?' => 'z', 'Á' => 'a', 'Ä' => 'A', '?' => 'C', '?' => 'D', 'É' => 'E', 'Í' => 'I', '?' => 'L', '?' => 'L', '?' => 'N', 'Ó' => 'O', 'Ô' => 'O', '?' => 'R', '?' => 'S', '?' => 'T', 'Ú' => 'U', 'Ý' => 'Y', '?' => 'Z', ], // French 'fr' => [ ], // Austrian (French) 'fr_at' => [ 'ß' => 'sz', '?' => 'SZ', ], // Switzerland (French) 'fr_ch' => [ 'ß' => 'ss', '?' => 'SS', ], // German 'de' => [ 'Ä' => 'Ae', 'Ö' => 'Oe', 'Ü' => 'Ue', 'ä' => 'ae', 'ö' => 'oe', 'ü' => 'ue', 'ß' => 'ss', '?' => 'SS', ], // Austrian (German) 'de_at' => [ 'Ä' => 'AE', 'Ö' => 'OE', 'Ü' => 'UE', 'ß' => 'sz', '?' => 'SZ', 'ä' => 'ae', 'ö' => 'oe', 'ü' => 'ue', ], // Switzerland (German) 'de_ch' => [ 'Ä' => 'Ae', 'Ö' => 'Oe', 'Ü' => 'Ue', 'ä' => 'ae', 'ö' => 'oe', 'ü' => 'ue', 'ß' => 'ss', '?' => 'SS', ], // English 'en' => [ ], 'latin' => [ '¹' => '1', '²' => '2', '³' => '3', '?' => '4', '?' => '5', '?' => '6', '?' => '7', '?' => '8', '?' => '9', '?' => '0', '?' => '1', '?' => '2', '?' => '3', '?' => '4', '?' => '5', '?' => '6', '?' => '7', '?' => '8', '?' => '9', 'æ' => 'ae', '?' => 'ae', 'Ä' => 'A', 'À' => 'A', 'Á' => 'A', 'Â' => 'A', 'Ã' => 'A', 'Å' => 'A', '?' => 'A', '?' => 'A', '?' => 'A', 'Æ' => 'AE', '?' => 'AE', 'ä' => 'a', 'à' => 'a', 'á' => 'a', 'â' => 'a', 'ã' => 'a', 'å' => 'a', '?' => 'a', '?' => 'a', '?' => 'a', 'ª' => 'a', 'Ç' => 'C', '?' => 'C', 'ç' => 'c', '?' => 'C', '?' => 'c', '?' => 'c', 'Ð' => 'D', '?' => 'D', 'ð' => 'd', '?' => 'd', 'È' => 'E', 'É' => 'E', 'Ê' => 'E', 'Ë' => 'E', '?' => 'E', '?' => 'E', 'è' => 'e', 'é' => 'e', 'ê' => 'e', 'ë' => 'e', '?' => 'e', '?' => 'e', '?' => 'f', '?' => 'G', '?' => 'G', '?' => 'g', '?' => 'g', '?' => 'H', '?' => 'H', '?' => 'h', '?' => 'h', 'Ì' => 'I', 'Í' => 'I', 'Î' => 'I', 'Ï' => 'I', '?' => 'I', '?' => 'I', '?' => 'I', '?' => 'I', '?' => 'IJ', 'ì' => 'i', 'í' => 'i', 'î' => 'i', 'ï' => 'i', '?' => 'i', '?' => 'i', '?' => 'i', '?' => 'i', '?' => 'ij', '?' => 'J', '?' => 'j', '?' => 'L', '?' => 'L', '?' => 'L', '?' => 'l', '?' => 'l', '?' => 'l', 'Ñ' => 'N', 'ñ' => 'n', '?' => 'n', 'Ö' => 'O', 'Ò' => 'O', 'Ó' => 'O', 'Ô' => 'O', 'Õ' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', '?' => 'O', 'Ø' => 'O', '?' => 'O', '?' => 'OE', 'ö' => 'o', 'ò' => 'o', 'ó' => 'o', 'ô' => 'o', 'õ' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', '?' => 'o', 'ø' => 'o', '?' => 'o', 'º' => 'o', '?' => 'oe', '?' => 'R', '?' => 'R', '?' => 'r', '?' => 'r', '?' => 'S', '?' => 'S', '?' => 's', '?' => 's', '?' => 's', '?' => 'T', '?' => 'T', '?' => 'T', 'Þ' => 'TH', '?' => 't', '?' => 't', '?' => 't', 'þ' => 'th', 'Ü' => 'U', 'Ù' => 'U', 'Ú' => 'U', 'Û' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', '?' => 'U', 'ü' => 'u', 'ù' => 'u', 'ú' => 'u', 'û' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'u', '?' => 'W', '?' => 'w', 'Ý' => 'Y', '?' => 'Y', '?' => 'Y', 'ý' => 'y', 'ÿ' => 'y', '?' => 'y', ], // non valid chars ' ' => [ "\xc2\xa0" => ' ', // 'NO-BREAK SPACE' "\xe1\x9a\x80" => ' ', // 'OGHAM SPACE MARK' "\xe2\x80\x80" => ' ', // 'EN QUAD' "\xe2\x80\x81" => ' ', // 'EM QUAD' "\xe2\x80\x82" => ' ', // 'EN SPACE' "\xe2\x80\x83" => ' ', // 'EM SPACE' "\xe2\x80\x84" => ' ', // 'THREE-PER-EM SPACE' "\xe2\x80\x85" => ' ', // 'FOUR-PER-EM SPACE' "\xe2\x80\x86" => ' ', // 'SIX-PER-EM SPACE' "\xe2\x80\x87" => ' ', // 'FIGURE SPACE' "\xe2\x80\x88" => ' ', // 'PUNCTUATION SPACE' "\xe2\x80\x89" => ' ', // 'THIN SPACE' "\xe2\x80\x8a" => ' ', // 'HAIR SPACE' "\xe2\x80\xa8" => ' ', // 'LINE SEPARATOR' "\xe2\x80\xa9" => ' ', // 'PARAGRAPH SEPARATOR' "\xe2\x80\x8b" => ' ', // 'ZERO WIDTH SPACE' "\xe2\x80\xaf" => ' ', // 'NARROW NO-BREAK SPACE' "\xe2\x81\x9f" => ' ', // 'MEDIUM MATHEMATICAL SPACE' "\xe3\x80\x80" => ' ', // 'IDEOGRAPHIC SPACE' "\xef\xbe\xa0" => ' ', // HALFWIDTH HANGUL FILLER ], ];