Изменение кодировки в Microsoft Excel

Изменение кодировки в Microsoft Excel

С потребностью менять кодировку текста часто сталкиваются пользователи, работающие браузерах, текстовых редакторах и процессорах. Тем не менее, и при работе в табличном процессоре Excel такая необходимость тоже может возникнуть, ведь эта программа обрабатывает не только цифры, но и текст. Давайте разберемся, как изменить кодировку в Экселе.

Работа с кодировкой текста

Кодировка текста – эта набор электронных цифровых выражений, которые преобразуются в понятные для пользователя символы. Существует много видов кодировки, у каждого из которых имеются свои правила и язык. Умение программы распознавать конкретный язык и переводить его на понятные для обычного человека знаки (буквы, цифры, другие символы) определяет, сможет ли приложение работать с конкретным текстом или нет. Среди популярных текстовых кодировок следует выделить такие:

  • Windows-1251;
  • KOI-8;
  • ASCII;
  • ANSI;
  • UKS-2;
  • UTF-8 (Юникод).

Последнее наименование является самым распространенным среди кодировок в мире, так как считается своего рода универсальным стандартом.

Чаще всего, программа сама распознаёт кодировку и автоматически переключается на неё, но в отдельных случаях пользователю нужно указать приложению её вид. Только тогда оно сможет корректно работать с кодированными символами.

Наибольшее количество проблем с расшифровкой кодировки у программы Excel встречается при попытке открытия файлов CSV или экспорте файлов txt. Часто, вместо обычных букв при открытии этих файлов через Эксель, мы можем наблюдать непонятные символы, так называемые «кракозябры». В этих случаях пользователю нужно совершить определенные манипуляции для того, чтобы программа начала корректно отображать данные. Существует несколько способов решения данной проблемы.

Способ 1: изменение кодировки с помощью Notepad++

К сожалению, полноценного инструмента, который позволял бы быстро изменять кодировку в любом типе текстов у Эксель нет. Поэтому приходится в этих целях использовать многошаговые решения или прибегать к помощи сторонних приложений. Одним из самых надежных способов является использование текстового редактора Notepad++.

    Запускаем приложение Notepad++. Кликаем по пункту «Файл». Из открывшегося списка выбираем пункт «Открыть». Как альтернативный вариант, можно набрать на клавиатуре сочетание клавиш Ctrl+O.

Запускается окно открытия файла. Переходим в директорию, где расположен документ, который некорректно отобразился в Экселе. Выделяем его и жмем на кнопку «Открыть» в нижней части окна.

После этого, чтобы сохранить изменения в файле жмем на кнопку на панели инструментов в виде дискеты. Закрываем Notepad++, нажав на кнопку в виде белого крестика в красном квадрате в верхнем правом углу окна.

  • Открываем файл стандартным способом через проводник или с помощью любого другого варианта в программе Excel. Как видим, все символы теперь отображаются корректно.
  • Несмотря на то, что данный способ основан на использовании стороннего программного обеспечения, он является одним из самых простых вариантов для перекодировки содержимого файлов под Эксель.

    Способ 2: применение Мастера текстов

    Кроме того, совершить преобразование можно и с помощью встроенных инструментов программы, а именно Мастера текстов. Как ни странно, использование данного инструмента несколько сложнее, чем применение сторонней программы, описанной в предыдущем методе.

      Запускаем программу Excel. Нужно активировать именно само приложение, а не открыть с его помощью документ. То есть, перед вами должен предстать чистый лист. Переходим во вкладку «Данные». Кликаем на кнопку на ленте «Из текста», размещенную в блоке инструментов «Получение внешних данных».

  • Открывается окно импорта текстового файла. В нем поддерживается открытие следующих форматов:
    • TXT;
    • CSV;
    • PRN.

    Переходим в директорию размещения импортируемого файла, выделяем его и кликаем по кнопке «Импорт».

    Открывается окно Мастера текстов. Как видим, в поле предварительного просмотра символы отображаются некорректно. В поле «Формат файла» раскрываем выпадающий список и меняем в нем кодировку на «Юникод (UTF-8)».

    Если данные отображаются все равно некорректно, то пытаемся экспериментировать с применением других кодировок, пока текст в поле для предпросмотра не станет читаемым. После того, как результат удовлетворит вас, жмите на кнопку «Далее».

    Открывается следующее окно Мастера текста. Тут можно изменить знак разделителя, но рекомендуется оставить настройки по умолчанию (знак табуляции). Жмем на кнопку «Далее».

  • В последнем окне имеется возможность изменить формат данных столбца:
    • Общий;
    • Текстовый;
    • Дата;
    • Пропустить столбец.

    Тут настройки следует выставить, учитывая характер обрабатываемого контента. После этого жмем на кнопку «Готово».

    В следующем окне указываем координаты левой верхней ячейки диапазона на листе, куда будут вставлены данные. Это можно сделать, вбив адрес вручную в соответствующее поле или просто выделив нужную ячейку на листе. После того, как координаты добавлены, в поле окна жмем кнопку «OK».

  • После этого текст отобразится на листе в нужной нам кодировке. Остается его отформатировать или восстановить структуру таблицы, если это были табличные данные, так как при переформатировании она разрушается.
  • Способ 3: сохранение файла в определенной кодировке

    Бывает и обратная ситуация, когда файл нужно не открыть с корректным отображением данных, а сохранить в установленной кодировке. В Экселе можно выполнить и эту задачу.

      Переходим во вкладку «Файл». Кликаем по пункту «Сохранить как».

    Открывается окно сохранения документа. С помощью интерфейса Проводника определяем директорию, где файл будет храниться. Затем выставляем тип файла, если хотим сохранить книгу в формате отличном от стандартного формата Excel (xlsx). Потом кликаем по параметру «Сервис» и в открывшемся списке выбираем пункт «Параметры веб-документа».

    В открывшемся окне переходим во вкладку «Кодировка». В поле «Сохранить документ как» открываем выпадающий список и устанавливаем из перечня тот тип кодировки, который считаем нужным. После этого жмем на кнопку «OK».

  • Возвращаемся в окно «Сохранения документа» и тут жмем на кнопку «Сохранить».
  • Документ сохранится на жестком диске или съемном носителе в той кодировке, которую вы определили сами. Но нужно учесть, что теперь всегда документы, сохраненные в Excel, будут сохраняться в данной кодировке. Для того, чтобы изменить это, придется опять заходить в окно «Параметры веб-документа» и менять настройки.

    Существует и другой путь к изменению настроек кодировки сохраненного текста.

      Находясь во вкладке «Файл», кликаем по пункту «Параметры».

    Открывается окно параметров Эксель. Выбираем подпункт «Дополнительно» из перечня расположенного в левой части окна. Центральную часть окна прокручиваем вниз до блока настроек «Общие». Тут кликаем по кнопке «Параметры веб-страницы».

    Открывается уже знакомое нам окно «Параметры веб-документа», где мы проделываем все те же действия, о которых говорили ранее.

    Теперь любой документ, сохраненный в Excel, будет иметь именно ту кодировку, которая была вами установлена.

    Как видим, у Эксель нет инструмента, который позволил бы быстро и удобно конвертировать текст из одной кодировки в другую. Мастер текста имеет слишком громоздкий функционал и обладает множеством не нужных для подобной процедуры возможностей. Используя его, вам придется проходить несколько шагов, которые непосредственно на данный процесс не влияют, а служат для других целей. Даже конвертация через сторонний текстовый редактор Notepad++ в этом случае выглядит несколько проще. Сохранение файлов в заданной кодировке в приложении Excel тоже усложнено тем фактом, что каждый раз при желании сменить данный параметр, вам придется изменять глобальные настройки программы.

    Изменение кодировки в Excel

    Если в таблице вместо нужной информации вы увидели вопросы, иероглифы или другие непонятные знаки, это значит, вам надо разобраться, как поменять кодировку в Excel. Эта функция доступна в самом Microsoft Office. Но избавиться от проблемы можно и другими методами.

    Иногда мы получаем непонятные иероглифы

    Что такое кодировка?

    Компьютер воспринимает любую информацию, как набор цифр. Поэтому у каждого печатного знака есть свой код. Он состоит из чисел и букв латинского алфавита. Символы и соответствующие им числа — это и есть кодировка.

    У неё есть несколько стандартов. Например, Koi-8, Unicode, Windows-1251, ASCII. И если файл с текстом сохранён, скажем, в Кои-8, в Excel он будет неправильно отображаться в Юникоде. Так как в этих наборах одним и тем же символам приписаны разные коды.

    Читайте также  Удаление лишних пробелов в Microsoft Excel

    Как поменять кодировку в программе?

    Для работы с таблицей, в которой используется стандарт, не заданный по умолчанию в программе, надо изменить кодировку. Существует несколько способов.

    При помощи Notepad

    Если в Экселе не получается превратить «кракозябры» в нормальный текст, откройте файл в программе «Notepad++». Она распространяется бесплатно. Настройте там отображение символов, а потом продолжайте работать в Excel.

    Откройте файл в программе «Notepad++»

    1. Создайте резервную копию документа. Или сохраните информацию из него в какой-нибудь другой таблице.
    2. Запустите Notepad.
    3. Перейдите в Файл — Открыть (File — Open) и укажите путь к таблице. В поле «Тип файла» поставьте «Все типы» («All types»). Или укажите конкретный формат. Таблицы имеют расширения .cvs, .xls, .xltm, xlam, .xlm. В Нотпаде текст отобразится без сетки. В нём ничего не надо редактировать.
    4. Справа внизу в строке состояния будет изображён стандарт, используемый сейчас.
    5. Откройте меню Кодировка (Encoding). Оно находится вверху окна.
    6. Нажмите «Преобразовать в UTF-8» («Convert to UTF-8»). Документ будет конвертирован в нужный формат. Этот стандарт Excel воспринимает нормально и не станет превращать в бессвязный поток странных символов.
    7. Теперь выберите, какие знаки необходимо использовать. В том же меню Encoding наведите выпадающий список. Он там один.
    8. Для русского языка выберите Кириллица — Windows-1251. Если текст, скажем, на арабском или греческом — отметьте соответствующий набор символов. В разных странах используются разные стандарты.
    9. Программа попросит подтвердить действие.
    10. Если это не помогло, попробуйте другие кириллические шрифты.
    11. Сохранять текст надо тоже в экселевском формате.

    Откройте файл в utf-8

    Через интерфейс программы

    Вот как сменить кодировку в Excel, используя встроенные возможности:

    1. Запустите программу. Не надо открывать заполненный документ. Нужен «чистый» лист.
    2. Перейдите во вкладку «Данные» в строке меню.
    3. На панели «Получать внешние данные» нажмите «Из текста».
    4. В списке «Тип файла» (он находится рядом с кнопкой «Отмена») выберите «Все» или «Любые». Так в окне будут отображаться форматы Excel, а не только .txt.
    5. Задайте путь к таблице.
    6. Откроется мастер импорта.
    7. В поле «Формат» можете выбрать желаемый стандарт.
    8. В области «Предварительный просмотр» показано, как будет выглядеть текст с отмеченным набором символов. Можете прокручивать список и искать, какая настройка подходит.
    9. Когда подберёте нужный вариант, нажмите «Готово».

    Можно использовать встроенные возможности

    Как сохранить файл в определённой кодировке?

    Можно сделать так, чтобы в сохранённом вами файле стояла определённая кодировка Excel.

    1. Нажмите на зелёную кнопку «Файл» (в Office 2007 надо кликнуть на логотип слева вверху).
    2. Параметры — Дополнительно.
    3. Прокрутите вниз до раздела «Общие».
    4. Кнопка «Параметры веб-документа».
    5. Вкладка «Кодировка».
    6. В поле «Сохранить документ как» укажите желаемое значение и нажмите «OK».

    Ещё можно сделать так:

    1. Нажмите на «Файл» или логотип офиса.
    2. Выберите «Сохранить как…».
    3. Кликните на «Сервис». Там будет тот же самый пункт «Параметры веб-документа».

    Как добавить в программы офиса новую кодировку?

    Если ни один из стандартов не подошёл для вашего документа, добавьте новые.

    1. Пуск — Панель управления.
    2. «Программы и компоненты» или «Удаление программ».
    3. Нажмите на пункт Office или Excel (в зависимости от того, установлен ли у вас весь пакет продуктов Микрософт Офис или только Эксель).
    4. Кнопка «Изменить». Она над основной рабочей областью.
    5. Поставьте маркер в «Добавить или удалить» и кликните «Продолжить».
    6. Откройте ветку Общие средства — Многоязыковая поддержка.
    7. Нажмите на чёрную стрелочку рядом с нужным стандартом и включите функцию «Запускать на моём компьютере».
    8. Кликните «Продолжить» и дождитесь окончания процесса. Будут добавлены новые наборы.

    В Excel можно поменять кодировку, если символы отображаются неправильно. Эта функция доступна в инструментарии программы. Но иногда используется сторонний софт.

    Выбор кодировки текста при открытии и сохранении файлов

    Как правило, при совместной работе с текстовыми файлами нет необходимости вникать в технические аспекты хранения текста. Однако если необходимо поделиться файлом с человеком, который работает с текстами на других языках, скачать текстовый файл из Интернета или открыть его на компьютере с другой операционной системой, может потребоваться задать кодировку при его открытии или сохранении.

    Когда вы открываете текстовый файл в Microsoft Word или другой программе (например, на компьютере, язык операционной системы на котором отличается от того, на котором написан текст в файле), кодировка помогает программе определить, в каком виде нужно вывести текст на экран, чтобы его можно было прочитать.

    В этой статье

    Общие сведения о кодировке текста

    Текст, который отображается в виде текста на экране, на самом деле сохраняется как числовые значения в текстовом файле. Компьютер переводит числовые значения в видимые символы. Для этого используется стандарт кодировки.

    Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквы, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.

    Различные кодировки для разных алфавитов

    Сведения о кодировке, сохраняемые с текстовым файлом, используются компьютером для вывода текста на экран. Например, в кодировке «Кириллица (Windows)» знаку «Й» соответствует числовое значение 201. Когда вы открываете файл, содержащий этот знак, на компьютере, на котором используется кодировка «Кириллица (Windows)», компьютер считывает число 201 и выводит на экран знак «Й».

    Однако если тот же файл открыть на компьютере, на котором по умолчанию используется другая кодировка, на экран будет выведен знак, соответствующий числу 201 в этой кодировке. Например, если на компьютере используется кодировка «Западноевропейская (Windows)», знак «Й» из исходного текстового файла на основе кириллицы будет отображен как «É», поскольку именно этому знаку соответствует число 201 в данной кодировке.

    Юникод: единая кодировка для разных алфавитов

    Чтобы избежать проблем с кодированием и декодированием текстовых файлов, можно сохранять их в Юникоде. В состав этой кодировки входит большинство знаков из всех языков, которые обычно используются на современных компьютерах.

    Так как Word работает на базе Юникода, все файлы в нем автоматически сохраняются в этой кодировке. Файлы в Юникоде можно открывать на любом компьютере с операционной системой на английском языке независимо от языка текста. Кроме того, на таком компьютере можно сохранять в Юникоде файлы, содержащие знаки, которых нет в западноевропейских алфавитах (например, греческие, кириллические, арабские или японские).

    Выбор кодировки при открытии файла

    Если в открытом файле текст искажен или выводится в виде вопросительных знаков либо квадратиков, возможно, Word неправильно определил кодировку. Вы можете указать кодировку, которую следует использовать для отображения (декодирования) текста.

    Откройте вкладку Файл.

    Нажмите кнопку Параметры.

    Нажмите кнопку Дополнительно.

    Перейдите к разделу Общие и установите флажок Подтверждать преобразование формата файла при открытии.

    Примечание: Если установлен этот флажок, Word отображает диалоговое окно Преобразование файла при каждом открытии файла в формате, отличном от формата Word (то есть файла, который не имеет расширения DOC, DOT, DOCX, DOCM, DOTX или DOTM). Если вы часто работаете с такими файлами, но вам обычно не требуется выбирать кодировку, не забудьте отключить этот параметр, чтобы это диалоговое окно не выводилось.

    Закройте, а затем снова откройте файл.

    В диалоговом окне Преобразование файла выберите пункт Кодированный текст.

    В диалоговом окне Преобразование файла установите переключатель Другая и выберите нужную кодировку из списка.

    В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.

    Если почти весь текст выглядит одинаково (например, в виде квадратов или точек), возможно, на компьютере не установлен нужный шрифт. В таком случае можно установить дополнительные шрифты.

    Читайте также  10 популярных статистических функций в Microsoft Excel

    Чтобы установить дополнительные шрифты, сделайте следующее:

    Нажмите кнопку Пуск и выберите пункт Панель управления.

    Выполните одно из указанных ниже действий.

    На панели управления выберите элемент Удаление программ.

    В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.

    В Windows Vista

    На панели управления выберите раздел Удаление программы.

    В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.

    На панели управления щелкните элемент Установка и удаление программ.

    В списке Установленные программы щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.

    В группе Изменение установки Microsoft Office нажмите кнопку Добавить или удалить компоненты и затем нажмите кнопку Продолжить.

    В разделе Параметры установки разверните элемент Общие средства Office, а затем — Многоязыковая поддержка.

    Выберите нужный шрифт, щелкните стрелку рядом с ним и выберите пункт Запускать с моего компьютера.

    Совет: При открытии текстового файла в той или иной кодировке в Word используются шрифты, определенные в диалоговом окне Параметры веб-документа. (Чтобы вызвать диалоговое окно Параметры веб-документа, нажмите кнопку Microsoft Office, затем щелкните Параметры Word и выберите категорию Дополнительно. В разделе Общие нажмите кнопку Параметры веб-документа.) С помощью параметров на вкладке Шрифты диалогового окна Параметры веб-документа можно настроить шрифт для каждой кодировки.

    Выбор кодировки при сохранении файла

    Если не выбрать кодировку при сохранении файла, будет использоваться Юникод. Как правило, рекомендуется применять Юникод, так как он поддерживает большинство символов большинства языков.

    Если документ планируется открывать в программе, которая не поддерживает Юникод, вы можете выбрать нужную кодировку. Например, в операционной системе на английском языке можно создать документ на китайском (традиционное письмо) с использованием Юникода. Однако если такой документ будет открываться в программе, которая поддерживает китайский язык, но не поддерживает Юникод, файл можно сохранить в кодировке «Китайская традиционная (Big5)». В результате текст будет отображаться правильно при открытии документа в программе, поддерживающей китайский язык (традиционное письмо).

    Примечание: Так как Юникод — это наиболее полный стандарт, при сохранении текста в других кодировках некоторые знаки могут не отображаться. Предположим, например, что документ в Юникоде содержит текст на иврите и языке с кириллицей. Если сохранить файл в кодировке «Кириллица (Windows)», текст на иврите не отобразится, а если сохранить его в кодировке «Иврит (Windows)», то не будет отображаться кириллический текст.

    Если выбрать стандарт кодировки, который не поддерживает некоторые символы в файле, Word пометит их красным. Вы можете просмотреть текст в выбранной кодировке перед сохранением файла.

    При сохранении файла в виде кодированного текста из него удаляется текст, для которого выбран шрифт Symbol, а также коды полей.

    Выбор кодировки

    Откройте вкладку Файл.

    Выберите пункт Сохранить как.

    Чтобы сохранить файл в другой папке, найдите и откройте ее.

    В поле Имя файла введите имя нового файла.

    В поле Тип файла выберите Обычный текст.

    Нажмите кнопку Сохранить.

    Если появится диалоговое окно Microsoft Office Word — проверка совместимости, нажмите кнопку Продолжить.

    В диалоговом окне Преобразование файла выберите подходящую кодировку.

    Чтобы использовать стандартную кодировку, выберите параметр Windows (по умолчанию).

    Чтобы использовать кодировку MS-DOS, выберите параметр MS-DOS.

    Чтобы задать другую кодировку, установите переключатель Другая и выберите нужный пункт в списке. В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.

    Примечание: Чтобы увеличить область отображения документа, можно изменить размер диалогового окна Преобразование файла.

    Если появилось сообщение «Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке», можно выбрать другую кодировку или установить флажок Разрешить подстановку знаков.

    Если разрешена подстановка знаков, знаки, которые невозможно отобразить, будут заменены ближайшими эквивалентными символами в выбранной кодировке. Например, многоточие заменяется тремя точками, а угловые кавычки — прямыми.

    Если в выбранной кодировке нет эквивалентных знаков для символов, выделенных красным цветом, они будут сохранены как внеконтекстные (например, в виде вопросительных знаков).

    Если документ будет открываться в программе, в которой текст не переносится с одной строки на другую, вы можете включить в нем жесткие разрывы строк. Для этого установите флажок Вставлять разрывы строк и укажите нужное обозначение разрыва (возврат каретки (CR), перевод строки (LF) или оба значения) в поле Завершать строки.

    Поиск кодировок, доступных в Word

    Word распознает несколько кодировок и поддерживает кодировки, которые входят в состав системного программного обеспечения.

    Ниже приведен список письменностей и связанных с ними кодировок (кодовых страниц).

    Юникод (UCS-2 с прямым и обратным порядком байтов, UTF-8, UTF-7)

    Стандартный шрифт для стиля «Обычный» локализованной версии Word

    Windows 1256, ASMO 708

    Китайская (упрощенное письмо)

    GB2312, GBK, EUC-CN, ISO-2022-CN, HZ

    Китайская (традиционное письмо)

    BIG5, EUC-TW, ISO-2022-TW

    Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866

    Английская, западноевропейская и другие, основанные на латинице

    Макрос перекодировки (изменения кодировки) текста и файлов

    Функции ChangeFileCharset и ChangeTextCharset предназначены для изменения кодировки символов в текстовых файлах и строках.

    Исходную и конечную (желаемую) кодировку можно задать в параметрах вызова функций.

    ВНИМАНИЕ: Новая (универсальная) версия функции сохранения текста в файл в заданной кодировке:
    http://excelvba.ru/code/SaveTextToFile

    Список доступных на вашем компьютере кодировок можно найти в реестре Windows в ветке
    HKEY_CLASSES_ROOTMIMEDatabaseCharset

    Среди доступных кодировок есть koi8-r, ascii, utf-7, utf-8, Windows-1250, Windows-1251, Windows-1252, и т.д. и т.п.

    Определить исходную и конечную кодировку можно, воспользовавшись онлайн-декодером:
    http://www.artlebedev.ru/tools/decoder/advanced/
    (после преобразования снизу будет написано, из какой кодировки в какую переведён текст)

    ‘ Функция для перекодировки файла в UTF-8 без BOM (то же самое, что и UTF-8, только без первых 3 байтов)

    Функция перекодировки текста в UTF-8 без BOM

    • 116225 просмотров

    Комментарии

    Добрый день! Необходимо конвертировать текст из ASCII (отрезанный старший бит) в Windows-1251. Каким образом можно модифицировать макрос для решения задачи?

    Надо выполнить замены для всех похожих букв по всему документу
    У меня на сайте есть решения только для Excel. Для word готового нет (можем сделать под заказ, или поищите готовый макрос в интернете, — вы явно не первый, кто с такой проблемой столкнулся)

    Добрый день.
    Парни, есть такая проблема, сам я из Казахстана, юзер пишет текст в ворде, например слово «СЛОВО», где буква С была написана на англ.языке, а все остальное слово на русском, или есть такие слова где русский язык и казахский (с казахской клавиатуры). Теперь при проверке на плагиат выходит ошибка кодировки, программа не понимает таких слов из двух или более языков, посоветуйте пожалуйста выход из такой ситуации, слышал что можно с помощью макросов, вот только с макросами не дружу, но в целом с понятия имею.

    Ребята, спасибо вам огромное !
    Это просто вечные ценности !
    Удачи вам.

    Огромное СПАСИБО за такой функционал!
    Полдня истратил, пока нашел, как же из Excel перевести данные в UTF-8.
    И тут такой подарок!
    Это просто супер!

    Здравствуйте, подскажите как пересохранить xls файл в формат csv с кодировкой utf8 без BOM разделитель ; с именем исходного файла

    Алексей, ну есть же в конце статьи отдельная функция для вашего случая.
    Вызывается так:

    Скажите пожалуйста,
    хотелось бы на выходе получить файл в кодировке UTF-8 без BOM
    вызываю так: ChangeFileCharset filename, «UTF-8», «Windows-1251»
    все нормально, но файл получается UTF-8
    а хотелось бы UTF-8 без BOM
    Это возможно? Если да, то как указать во втором параметре вызова функции?

    Здравствуйте, Павел
    В общем случае, кодировку txt файла никак не угадать (не проверить)
    Можно лишь попробовать угадать, анализируя первые байты текста (правда, верно угадать можно с вероятностью, очень близкой к 100%)

    Читайте также  Программа Microsoft Excel: сортировка и фильтрация данных

    Изменить кодировку без перезаписи файла — никак.
    Смена кодировки текстового файла — это изменение байтового представления этого текста
    (после перекодировки, файл может увеличиться или уменьшаться в размере в 2 раза)

    Готовый макрос предложить не могу (ни разу подобное не делал, и кода немало получится)

    Варианты решения проблемы:
    1) ручная обработка, при помощи текстового редактора Notepad++
    В нём можно открыть сразу кучу файлов, а потом, переключаясь между ними, смотреть текущую кодировку, и, при необходимости, перекодировать одним нажатием кнопки (см. меню Кодировки в Notepad++)

    2) макрос под заказ. высылаете несколько файлов для примера, указываете, где кодировка верная, а где надо исправить, — я посмотрю, что можно сделать (если там не несколько разных кодировок, — макрос по цене обойдется около 2 т.р.)

    А как 1) просто проверить кодировку текстового файла и вывести результат?
    и 2) изменить ее без перезаписи всего текста?
    Имеется в виду не кодировка текста, а та кодировка, которой файл помечен (для UTF-8, в частности, это два специфических сигнальных байта в начале файла, которые не отображаются как текст).
    Нужно вот для чего. Обнаружилось, что если NC-файл (фактически это просто текстовый файл) для ЧПУ сохранен в кодировке, отличной от ANSI, то это вызывает зависание машины, в каком-то подлом проценте случаев. Теперь надо все файлы перепроверить и починить. А их тысячи.
    Если при пересохранении в ANSI будут потеряны какие-то буквы — не страшно. Эти неанглийские буквы попадаются там только в комментариях к коду. Никто не знал о такой засаде и писали как попало.

    У меня почему-то при кодировании анси в уникод, не прокатил параметр «utf-8», а получилось только с «Unicode».

    Как изменить кодировку в Excel

    Как правило, смена кодировки чаще бывает необходима для тех, кто работает с Интернет обозревателями и текстовыми редакторами. Но все же бывают случаи, когда нужно изменить кодировку в Excel. Обычно это происходит после импортирования в экселевский проект txt и csv материалов. В этой статье мы разберем два рабочих способа изменения кодировки с помощью самого Экселя, то есть без установки дополнительных приложений.

    Смена кодировки методом сохранения файла с доп. настройками
    Такой вариант подходит только для тех случаев, когда Вам нужно не открыть файл с иной кодировкой, а наоборот – сохранить его, предварительно указав новую кодировку.

    1. Откройте Эксель. Зайдите на вкладку «Файл» и нажмите «Сохранить как».

    3. Теперь выберите вкладку «Кодировка» и щелкните по «Сохранить документ как». В открывшемся перечне отметьте необходимую кодировку.

    4. Теперь просто сохраните документ.

    Важно: после таких манипуляций кодировка, которую Вы указывали, будет выбираться для всех последующих проектов.

    Мастер текстов
    К сожалению, данный способ чуть сложнее, чем замена кодировки с помощью сторонних текстовых процессоров, но зато он не подразумевает установку дополнительных программ. Инструмент «Мастер текстов» есть в самом Екселе.
    1. Откройте Excel и щелкните по вкладке «Данные». Затем нажмите ЛКМ на «Получение внешних данных» и выберите «Из текста».

    2. Через «Проводник» импортируйте документ с текстом. Поддерживаемые форматы: TXT, CSV, PRN.

    3. Через предварительный просмотр файла видно, что кодировки не совпадают. Из выпадающего списка «Формат файла» выберите значение «Юникод (UTF-8)».

    4. Если в поле предварительного просмотра вместо текста снова какие-то непонятные символы, тогда пробуйте выбрать другую кодировку. Например, ASCII или ANSI.

    5. Здесь лучше оставить все параметры по умолчанию.

    6. Третий шаг позволяет менять формат данных. Если Вам это не нужно, просто нажмите «Готово».

    7. Теперь укажите координаты, куда следует поместить данные. После чего кликните по кнопке «ОК».

    8. Результаты проделанной процедуры.

    Как видите, чтобы изменить кодировку в Excel, нужно слегка попотеть. К сожалению, в данной программе нельзя легко «подружить» типы кодировок, но потратив несколько минут, Вы все же добьетесь своего.

    CSV в Excel: как открыть без искажения данных и смены кодировки

    При работе с различными сайтами, особенно с интернет-магазинами, очень часто приходится пользоваться импортом и экспортом CSV файлов для того чтобы массово изменить данные. Сам по себе формат максимально прост и легковесен, поэтому популярен в среде WEB. Благодаря минимализму он позволяет быстро изменять большие массивы данных.

    Мы разработали надстройку — расширение для Excel, которое решает все проблемы открытия CSV в Excel в виде таблицы.

    Скачать расширение 100% вирусов нет, это не любительский блог!

    Видео инструкция

    Несмотря на популярность формата при открытии этих данных в Excel начинаются проблемы — Excel изменяет содержимое ячеек еще до того, как вы его увидите! Он обрезает нули у артикулов, превращает штрих-коды и числовые данные в даты, обрезает длину описаний и ведет себя как сырой продукт из-за автоматического форматирования данных! И самое печальное в этой истории — это никак не отключить. Это фундаментальная неграмотность разработчиков, ведь данные должны открываться как есть и без нашего разрешения/действия меняться не должны.

    И вроде бы в программе есть импорт CSV, где можно выбрать кодировку и разделители, но файлы открываются все равно криво и исправления мы вряд ли дождемся.

    Все, кого это коснулось — действуйте, эти разработчики думают что проблема только у единиц, поэтому кликайте кнопку ниже и напишите свое мнение на официальном форуме.

    Не стесняемся английского — используем переводчик Яндекса.

    Если Excel убирает нули артикулов и цифр и искажает данные CSV

    Из-за недостаточного внимания к этой проблеме пришлось решать ее самостоятельно. Хотя можно было добавить в настройки Excel отключение функции автоматического форматирования. Причем по умолчанию автоформатирование должно быть отключено т.к. мне сложно представить мазохиста, которому это нужно.

    Excel и utf-8: файл CSV открывается с каракулями в кодировке юникода

    Это очень частая проблема открытия CSV в Excel. Проблема в том, что эксель работает только с кириллической кодировкой Windows-1251. В некоторых CMS, например в CS-Cart экспорт производится только в кодировке UTF-8, из за чего работа с файлом в Excel становится невозможной. Чтобы постоянно не менять кодировку файла «на коленках» и исключить вероятность ошибки по невнимательности при работе с большим количеством файлов мы обновили надстройку, приложенную ниже. Теперь перед импортом CSV файла вы можете выбрать кодировку.

    Функции надстройки:

    1. Возможность выбирать разделители
    2. Возможность выбора кодировки открываемого файла
    3. Открытие ячеек в текстовом формате, без искажения данных
    4. Контроль правильности разбивки ячеек

    Установка очень простая — открываем файл, разрешаем редактирование файла и кликаем по большой красной кнопке «Установить надстройку».

    После этого в верхней части программы Excel появится вкладка «Надстройки», в которой будет 3 пункта — для открытия CSV файла и для смены кодировки и разделителей открываемого CSV файла.

    Обратите внимание что все CSV файлы нужно открывать только через кнопку «Открыть CSV».

    Как открыть CSV в Libreoffice/OpenOffice

    Многие из-за этой проблемы переходят на LibreOffice (либо его более худшего брата OpenOffice). При открытии файла CSV тут тоже не все гладко, но хотя бы додумались до окна перед открытием файла, где можно указать тип ячеек как «Текст».

    К сожалению сложные формулы в этих офисных пакетах работают очень часто некорректно, поэтому полноценную замену Excel они дать не могут.