Skip to content

Расшифровка нескольких кодировок сразу #2

@petr-akhlamov

Description

@petr-akhlamov

Здравствуйте. А возможно ли как-то обработать с помощью rurecoder-а текст, который включает не один тип кракозябр, а несколько?

Сейчас, если, например, ввести текст из двух кракозябр, rurecoder распознает только последнюю.

Я пытался придумать алгоритм, чтобы корректно обработать.

  • по буквам если разбивать, он часто некорректно распознает
  • по словам, тоже часто путает, когда раздельно

Возможно ли как-то различать кракозябры с помощью какого-то триггера? Например, утилита считывает абзацы/строки, идут кракозябры одного типа, одной кодировки, она их отщипляет, распознает. Идет дальше. Другой тип закончился, начался третий. Второй тип отщепила, распознала. И т.д.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions