OptimizeWordHtmlv2.1

Вопрос об оптимизации Word-овских Html-файлов я слышал давно. Оказывается, многие пользуются Word-ом для создания html-страниц. Это понятно, так как все работают на Word2000 или WordXP, который знают лучше других программ.. С Word97 этот вопрос не стоял, так как в нем использовался старый HTML-2, который уже давно не используется в Интернете. Так вот, несмотря на наличие большого числа специальных редакторов типа DreamWeaver, HomeSite, даже FrontPage некоторые не хотят утруждать себя их изучением и продолжают верстать ВЭБ-страницы с помощью Word-а. Ну, это их дело.

Другая категория пользователей использует Word по другой причине. Я, например, сканированные документы распознаю FineReader-ом, исправляю ошибки и обрабатываю в Word-е, затем перевожу в Html и довожу до ума с помощью Блокнота. Я давно сделал программу, оставляющую голые теги в Вордовском Html, убирающую до 95% из файла, потом сам форматирую документ. Но ведь не все знают HTML и CSS, да и длительный это путь, поэтому  пришлось программку переделать.

Теперь программа не просто удаляет все лишнее, она анализирует, насколько тот или иной тег влияет на форматирование документа и удаляет все то, что считает ненужным.

Это скриншот программы. Как видно, кроме списка файлов после оптимизации выдается информация об удаленных тегах (при пакетной обработке – общее число во всех файлах, то же и о числе удаленных байт. При одиночной обработке вид программы немного другой. Переход с одиночной обработки на пакетную происходит после выбора файлов автоматически.

Впрочем, в программе все это есть в меню «Помощь».

Разумеется, степень оптимизации зависит от вида информации в файле. Наибольшей обладают документы, имеющие много таблиц, списков, мелких абзацев. Наименьшей - содержащие много текстовой информации в крупных абзацах.

В программе есть три режима форматирования:

Первый режим позволяет оставить форматирование максимально соответствующее оригиналу документа, уменьшая размер файла в 3-5 раз. Если Вы набрали документ, сохранили как ВЭБ-страницу и хотите оптимизировать для публикации в Интернет, то этот режим для Вас. Тогда совет – сразу форматируйте страницу с помощью таблиц, то есть колонки с текстом и рисунки размещайте в ячейках таблиц, так как Word при конвертировании в ВЭБ-страницу текста в колонках и рисунков, обтекаемых текстом, игнорирует как колонки, так и обтекаемость. Отмените границы таблиц, если нужно. Разместите также гиперссылки, и Вам больше не нужно будет после оптимизации переделывать страницу. 

Второй режим разрешает небольшие отличия от исходного при уменьшении размера файла в 4-7 раз. Все-таки Word не полностью подходит для создания ВЭБ-страниц, поэтому все равно приходится доделывать своими ручками. Этот режим позволяет оставить основное форматирование (шрифты, цвет шрифта, размер, стили), остальное доделываем сами.

Третий режим – это режим очистки документа от всего, остаются голые теги, то есть структура документа. Режим рассчитан на опытных пользователей, знающих HTML и CSS.

Для примера можете посмотреть документы:

Дальше. Программа позволяет производить одиночную и пакетную обработку. Работать с ней очень просто. Открываем файл или группу файлов, выбираем режим форматирования и режим сохранения результата и жмем «Оптимизировать». Смотрим, что получилось.

Кстати, последние настройки программы сохраняются в файле optwhtm.ini. Если его нет, то устанавливаются настройки по умолчанию, а этот файл тут же создается в папке, где лежит сама программа. Строго говоря, это не совсем файл .ini, хотя хранит настройки. Я не использую стандартное содержание этого файла, так проще.

Еще раз кстати. Все страницы этого сайта набраны именно в WordXP и оптимизированы с помощью OptimizeWordHtml, дело принципа, знаете ли...

Программка создана в Delphi6 с применением кодоэкономичной библиотеки KOL и MCK (http://xcl.cjb.net, http://bonanzas.rinet.ru).

*** В версии 2.1 устранены мелкие недостатки и написана помощь.

Если Вы заинтересовались, то скачать программу можете по этой ссылке:

Скачать программу OptimizeWordHtml - размер архива 48 кб.

На главную страницу