Так это выглядит для меня, как вы не ожидали бы, чтобы отсортировать их в том же порядке, даже в японских локализаций. Интересно, есть ли на самом деле какое-то ошибка, что было сделано в сортировке этого текстового файла.
Я не думаю, что там было сортировки. Или была изначально, и со временем он пополз в сторону несортированный. Потому что вот вещь: японский список не может только ~ 50% тестовых векторов. Так что, если вы бежите вышеупомянутые векторы JSON, первый тест
проходит, в то время как второй
не.
Таким образом, в списке слов っ つ и сортируются как же буквы. Это может быть стандартным для японской локализации, но если вы не установили это локализации вы получите другой порядок.
Да, но
конечный пользователь не видит список. Списки слов создаются и используются исключительно разработчиками, так что это не должно иметь значения, какой стандарт это, потому что код ищет, чтобы найти список слов сортируются (по) элемент кода.
Возможно, безотказный BIP39 следует проверить, что
отсортированный (словник) == wordlist.txt
Плохо то, что метод двоичного поиска в инструменте bip39 мнемоклависайте не работает, если список не отсортирован. Так, например, единичные тесты питона-мнемоник неудачу.
См. Выше Это более коварно. Только
некоторые векторов терпят неудачу. В Python, неисправность возвращает двоичное значение (-) 1. Кроме того, локаль вопрос снова, как японские векторы не в состоянии
энтропия ==>мнемонический если вы не вернете мнемонику с идеографическими пространствами
Глядя на официальные bip39 Словарных, кажется, других языках имеют те же проблемы, например,
Французский:
belette
bйlier
Белот
bйnйfice
Berceau
Я не уверен, что правильное решение является. Сортировка списка слов с LANG = C изменит индексы слов и нарушить совместимость. Требование о том, настройки локализации должны соответствовать языку списка слов сделать автоматические тесты трудно. Особенно, если вы не имеете поддержку установленного языка.
Еще одна проблемы с французами (хотя 2 языка для китайцев наихудший) .... Французские WordList акции 100 слов с английским языком. Таким образом, вектор с энтропией 32 nullbytes, например, для, можно дифференцировать только как французский язык (английский язык =
отказаться отказаться от отказаться отказаться отказаться от отказаться отказаться отказаться от отказаться отказаться отказаться от о) С помощью контрольной суммы, поскольку
отказаться от является французский и английский (по-разному индекс слишком IIRC). Но это не всегда возможно, так как мнемонические иногда может быть все общие слова. Не тот же вопрос, но индексы будут различаться для каждого языка.
Между Электрума делать свою собственную вещь, и каждый bip39 языка будучи Unsorted, есть важные вопросы, которые нуждаются в сглаживании раньше, чем позже ..
Странная вещь, только ты 2, кажется, согласен есть проблема в том, региональном отсортировано слове!