Как очистить документ ворд от мусора
Перейти к содержимому

Как очистить документ ворд от мусора

  • автор:

 

2.2. «Очистка» текста документа от «мусора»

Когда текст документа формируется из различных источников, оформление скомпонованного документа получается весьма «пестрым». Кроме того, при копировании фрагментов интернет-страниц из браузера или фрагментов текста из других документов, а так же при сканировании и распознавании текста в итоговом документе очень часто помимо различного оформления бывает еще очень много не к месту использованных символов оформления.

Для «очистки» документа от подобного «мусора» необходимо в первую очередь включить режим отображения непечатаемых символов. Этот режим позволяет наглядно видеть некоторые нюансы оформления документа. Далее необходимо выполнить следующие действия, используя инструменты поиска и замены:

Удалить все мягкие переносы;

Мягкий перенос, обозначающийся значком ¬, используется для указания места для разрыва слова или словосочетания, если оно попадет в конец строки. Например, можно указать, что слово «автоформат» должно быть перенесено как «авто-формат», а не «автофор-мат». Если слово, в которое вставлен мягкий перенос, находится не в конце строки, этот перенос будет виден только при включенном параметре Отобразить все знаки. Чтобы создать мягкий перенос, нужно в нужном месте нажать сочетание клавиш Cntrl+Дефис.

Главная задача переноса слов — эстетическая. Недостатком мягкого переноса является его фиксированность, так что при копировании или форматировании текста перенос остаётся, хотя данный перенос может быть уже не нужен.

1.1 Удалить автоматическую расстановку переносов

На вкладке Разметка страницы в группе Параметры страницы нужно выбирать команду Расстановка переносов, а затем команду Нет (Рис. 27).

Рис. 27 – Удаление автоматической расстановки переносов

1.2 Удалить переносы, расставленные вручную

На вкладке Начальная страница в группе Редактирование нужно выбрать команду Заменить (Рис. 28).

Рис. 28 — Удаление переносов, расставленных вручную

Нажимаем кнопку Больше, а затем выбираем один из нужных пунктов (Рис. 29).

Рис. 29 – Открытие расширенной версии окна Найти и заменить

Откроем пункт Специальный (Рис. 30).

Рис. 30 – Пункт Специальный

Выберем пункт Мягкий перенос в поле Найти, чтобы удалить мягкие переносы (Рис. 31).

Рис. 31Мягкий перенос в поле Найти

Оставим поле Заменить на пустым (Рис. 32).

Рис. 32 – Пустое поле заменить на

Нажмём кнопку Заменить все.

Заменить неразрывные пробелы на обычные;

При редактировании документов часто возникают ситуации, когда разбивается и переносится на следующую строку информация, которую по правилам правописания недопустимо разрывать (инициалы, нумерация, единицы измерения и т.п.). В этом случае используют неразрывный пробел, предотвращающий нежелательные переносы и разрывы строк.

Он ставится посредством одновременного нажатия Ctrl + Shift + Space bar (пробел).

Если мы посмотрим на непечатаемые знаки, то он изображается в виде маленького кружка:

Недостаток неразрывного пробела состоит в том, что фраза становится единым целым и ни поддаётся никакому форматированию.

В поле Найти выберем пункт неразрывные пробелы.

В поле Заменить на нажмём один раз на пробел.

Нажмём кнопку Заменить все (Рис. 33).

Рис. 33 — Замена неразрывных пробелов на обычные

3. Заменить знаки разрыва строк на знаки абзаца;

При вставке принудительного разрыва строки текущая строка обрывается, и текст продолжается на следующей строке. Предположим, например, что стиль абзаца включает в себя отступ перед первой строкой. Чтобы избежать появления отступа перед короткими строками текста (например, в написании адреса или в стихотворении), каждый раз, когда нужно начать новую строку, вместо того чтобы нажимать клавишу Enter, можно вставить знак разрыва строки ( ) с помощью сочетания клавиш Shift+Enter.

Данный знак неудобен тем, что при любом форматировании он оставляет текст «стихотворением».

Заменяя знак разрыва строки на знак абзаца () ( вызывается клавишей Enter), можно привести текст к нормальному виду.

В поле Найти выберем пункт разрыв строки.

В поле Заменить на выберем пункт знак абзаца.

Нажмём кнопку Заменить все (Рис. 34).

Рис. 34 — Замена знаков разрыва строк на знаки абзаца

4. Заменить двойные пробелы на одинарные;

Двойной пробел в MS Word не имеет смысла, так как редактор регулирует длину пробела самостоятельно, если выбрано выравнивание по ширине.

Знак пробела обозначается в виде ·.

В поле Найти вводим двойной пробел, в поле Заменить на одиночный пробел.

Нажмём кнопку Заменить все (Рис. 35).

Рис. 35 — Замена двойных пробелов на одинарные

Важно! Необходимо проводить замену до тех пор, пока Word не сообщит, что число выполненных замен равно 0. Так же необходимо проверять, чтобы в полях Найти и Заменить на действительно были два и один пробел соответственно.

5. Вручную удалить лишние знаки табуляции и пустые строки, где это необходимо.

Нажатие клавиши Tab при вводе текста перемещает курсор ввода и следующий за ним текст на новую позицию табулятора. Выравнивание текста соответствует виду данного табулятора. В тексте появляется непечатаемый символ табуляции →, который отмечает место нажатия клавиши Tab.

Ранее знаки табуляции использовали для упрощения форматирования документа (отступа на первой строке к примеру) и создания таблиц, но начиная с Word 2003 табуляцию в основном используют при нумерации.

Пустые строки для визуального выделения частей текста, но при неправильном применении они могут превратить текст в набор строк.

Необходимо вручную удалять лишние знаки табуляции и пустые строки, так как полное удаление данных знаков нанесёт не меньший вред тексту, чем наличие лишних знаков.

После выполнения указанных действий остается только оформить текст в соответствии с требованиями методички по оформлению [1].

Как удалять стилевой мусор не поштучно, а за один приём?

Задача: после приведения в божеский вид цифровых гранок, полученных в несколько этапов из PDF, нужно убрать из него массу ранее созданных автоматически паразитных служебных стилей, большая часть из которых уже не используется, однако в файле присутствует. Их обычно штук по 20–40.
Приличные люди в таком виде файлы клиентам не отправляют, только вот никаких средств для удаления этого паскудства в очевидном месте в Word 2010 я так обнаружить и не сумел.
Как можно видеть, что в штатной панели стилей, что в диалоговом окне, якобы специально предназначенном для управления стилями (sic!) по определению невозможно выбрать их столько, сколько требуется (даже не в произвольном порядке, а хотя бы диапазон!).
Как удалять стилевой мусор не поштучно, а за один приём?
А чтобы не показалось вдруг мало, интеллектуалы-профессионалы из Microsoft ещё и считают обязательным потребовать подтвердить каждое решение об удалении стиля!
Как удалять стилевой мусор не поштучно, а за один приём?
Кто пробовал проделать такую операцию хотя бы раз 15, хорошо знает испытываемые при этом чувства и стремления…
Может, кто-нибудь знает нормальный способ устранения стилевого хлама?
Казалось бы, элементарная вещь, но мелкомягкие и её превратили в вечный бой…

2 Ответ от Alex_Gur 19.06.2012 18:47:08

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Интересный вопрос! Сам часто мучаюсь.
Пока могу предложить только следующий макрос:

Поскольку, как правило, такие "мусорные" стили имеют однотипные названия, то их довольно легко указывать в макросе копированием.
В принципе, эти стили, скорее всего, имеют номера в коллекции Styles, идущие подряд, но проблема будет состоять в том, каким образом узнать эти номера.
Если номера стилей будут известны, то легко организуется цикл.

3 Ответ от Brains 19.06.2012 18:55:16

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

…их довольно легко указывать в макросе копированием.
В принципе, эти стили, скорее всего, имеют номера в коллекции Styles, идущие подряд, но проблема будет состоять в том, каким образом узнать эти номера.

Только-то? То есть само по себе копирование нескольких десятков машиночитаемых названий — это уже и не проблема (особенно если их удалось предварительно выяснить)?
Загоняем, в общем, таракана под шкаф, и отпиливаем шкафу ножки… sad

4 Ответ от Brains 19.06.2012 19:06:38

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Я-то, собственно, нашёл очевидный паллиатив, который на порядок уменьшает объём кретинической работы (всё-таки после обработки файла большинство стилей существует только в таблице, но в самом тексте-то их нет), но это в любом случае некомильфотно и сильно напоминает решение проблемы профессиональной импотенции части ведущих программистов Microsoft (точнее, их хамского отношения к сектору B2C) посредством деревянной ложки и изоленты.

5 Ответ от aap77 19.06.2012 19:18:38

  • aap77
  • генерал-полковник
  • Неактивен
  • Зарегистрирован: 12.09.2011
  • Сообщений: 925
  • Поблагодарили: 243
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Я вообще стили, которыми обрабатываю файлы, обозначаю своим значком и остальные скрываю либо удаляю.

6 Ответ от Brains 19.06.2012 19:24:46

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Да, но это никоим образом не решает проблему. Задача ведь в том, чтобы мусор удалить, а не замести его под ковёр или смыть вместе с мебелью, орудуя пожарным брандспойтом.

7 Ответ от aap77 19.06.2012 19:33:58

  • aap77
  • генерал-полковник
  • Неактивен
  • Зарегистрирован: 12.09.2011
  • Сообщений: 925
  • Поблагодарили: 243
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Тогда предлагаю такой алгоритм.
Перебираете все стили с поиском в файле ищете стиль, если его нет, то удаляете

8 Ответ от Вождь 19.06.2012 19:49:37

  • Вождь
  • Модератор
  • Неактивен
  • Зарегистрирован: 07.01.2010
  • Сообщений: 745
  • Поблагодарили: 181
  • За сообщение: 1
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Самый простой способ — выделить все и скопировать в новый документ. Неиспользуемые стили останутся в старом.

9 Ответ от Brains 19.06.2012 19:51:01

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Перебираете все стили с поиском в файле ищете стиль, если его нет, то удаляете

И так несколько десятков раз… Нет уж, спасибо.
Короче, Идет ветер к югу, и переходит к северу, кружится, кружится на ходу своем, и возвращается ветер на круги свои. © Пока что из всего этого следует вывод, что с моей собственной квалификацией всё в порядке: необходимый и очевидный грамотным пользователям инструментарий в Word попросту отсутствует.
Дело не во мне, а в последовательной ориентации разработчиков на самую безмозглую и некомпетентную часть пользователей Потребности последних, учитывая ничтожный процент в общей массе покупателей лицензий, и, следовательно, ничтожную долю прибыли от них, исторически игнорируются. А пипл, тот всё хавает… hmm

10 Ответ от Brains 19.06.2012 19:55:45

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Самый простой способ — выделить все и скопировать в новый документ.

Ну да, об этом я и писал выше. Если что осталось недочищеным, его существенно меньше, меньше и мороки. Но для этого нужно создавать новый документ, писать его поверх старого… Деревянная нога лучше, чем вовсе никакой, но с настоящей живётся всё-таки легче.
А мелкомягким быдлокодерам — стыд и срам.

 

11 Ответ от Alex_Gur 19.06.2012 20:04:05

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Приложите, пожалуйста, ваш файл. Можно с небольшим количеством текста. Попробуем удалить шрифты. smile

12 Ответ от Alex_Gur 19.06.2012 20:07:57

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Самый простой способ — выделить все и скопировать в новый документ.

Проблема часто как раз заключается в том, что все эти "мусорные" стили так или иначе используются. У меня это часто получается после распознавания текста. Хорошо бы эти стили удалить, чтобы соответствующий текст преобразовался в Обычный.

13 Ответ от Brains 19.06.2012 20:08:00

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Ой, а шрифты-то тут каким боком?!
Только прикладывать мне, увы, нечего: то, что было доведено до этапа, требующего чистки, уже почищено описанными выше перректальными способами, а новый файл ещё надо подготовить…
Но насчёт шрифтов всё равно интересно. Неожиданный поворот сюжета.

14 Ответ от Вождь 19.06.2012 20:11:12

  • Вождь
  • Модератор
  • Неактивен
  • Зарегистрирован: 07.01.2010
  • Сообщений: 745
  • Поблагодарили: 181
Re: Как удалять стилевой мусор не поштучно, а за один приём?

. нужно создавать новый документ, писать его поверх старого…

Можно без нового: копируем в буфер, удаляем все стили, вставляем из буфера.

. мелкомягким быдлокодерам — стыд и срам.

У них принципиально другой подход к работе, не для наших мозгов smile

15 Ответ от Brains 19.06.2012 20:17:09

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Проблема часто как раз заключается в том, что все эти "мусорные" стили так или иначе используются.

Да нет, в моём случае даже если они и используются, это — мусор. Речь идёт о цифровых гранках, то есть стили в них могут быть либо типовые, из шаблона Normal, либо пара-другая моих собственных, создаваемых на моё усмотрение и по согласованию с клиентом. Я включаюсь в цепочку обработки контента примерно между редакцией и участком вёрстки и публикации, так что моё дело — выдать на-гора нормальный издательский текстовый оригинал. Всё, что родилось само собою и непорочно — фтопку.

16 Ответ от Alex_Gur 19.06.2012 20:21:47

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Самый простой способ — выделить все и скопировать в новый документ.

Проблема часто как раз заключается в том, что все эти "мусорные" стили так или иначе используются. У меня это часто получается после распознавания текста. Хорошо бы эти стили удалить, чтобы соответствующий текст преобразовался в Обычный.

Оказывается, что макрос:

прекрасно удаляет стили, которые используются в тексте, а текст преобразуется в стиль Обычный. Чудеса! alt=»smile» width=»15″ height=»15″ />
Они все-таки не так глупы, как это кажется! alt=»smile» width=»15″ height=»15″ />

Следующий макрос выводит по одному номера стилей в коллекции и их наименования:

Было бы хорошо выводить все это не в окно на экране, а в активный файл Word, но пока не знаю, как это сделать. Коллеги, не могли бы посоветовать?

17 Ответ от Brains 19.06.2012 20:27:23

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Они все-таки не так глупы, как это кажется! smile

18 Ответ от Alex_Gur 19.06.2012 20:38:42

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Они все-таки не так глупы, как это кажется! smile

Разработчики.
Радует, что при удалении стиля не задается указанный вами вопрос: "Удалить стиль . из документа?", а соответствующий текст автоматически преобразуется во что-то разумное (в данном случае, в стиль Обычный).

19 Ответ от Alex_Gur 19.06.2012 20:40:39

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Все же, кто-нибудь в курсе, как записать результаты действия макроса в файл Word (или хотя бы в файл TXT)?

20 Ответ от Alex_Gur 19.06.2012 21:07:22

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Все же, кто-нибудь в курсе, как записать результаты действия макроса в файл Word (или хотя бы в файл TXT)?

Нашел следующее решение:

Теперь будет удобно удалять ненужные стили.

21 Ответ от Brains 19.06.2012 21:09:41

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Разработчики.
Радует, что при удалении стиля не задается указанный вами вопрос…

Так вы ж его макрокомандой (типа изнутри) удаляете, а не через графический интерфейс! Чтобы создать нормальный пользовательский интерфейс, нужна оооочень солидная квалификация и огромная ширина кругозора, сильно выходящие за рамки быдлокодерства (сродни поездке медведя на мотоциклете).
То, что эти особи не мешают вам работать на уровне программного кода, говорит не о том, что ответственные за развитие продукта особи пригодны для того, чем занимаются, но что они не являются сознательными вредителями. И на том, конечно, спасибо, но Дилберту от этого не легче. И мне бы вот интерфейсу хотелось бы осмысленного.

22 Ответ от Brains 19.06.2012 21:13:21

  • Brains
  • сержант
  • Неактивен
  • Зарегистрирован: 26.07.2010
  • Сообщений: 26
  • Поблагодарили: 2
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Теперь будет удобно удалять ненужные стили.

Не будет. Удобно — это когда кандидатов на удаление можно указать в произвольном порядке мышью, после чего запустить удаление всего выбранного одной комендой или нажатием 1 кнопки.

23 Ответ от Alex_Gur 20.06.2012 04:04:24

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Теперь будет удобно удалять ненужные стили.

Не будет. Удобно — это когда кандидатов на удаление можно указать в произвольном порядке мышью, после чего запустить удаление всего выбранного одной комендой или нажатием 1 кнопки.

Верно. Так было бы лучше.

24 Ответ от aap77 20.06.2012 06:42:55

  • aap77
  • генерал-полковник
  • Неактивен
  • Зарегистрирован: 12.09.2011
  • Сообщений: 925
  • Поблагодарили: 243
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Вообще-то я незаморачиваюсь на эту тему, как бывшего верстальщик, на должности швеца-жнеца выработал свою стратегию работы. Со стилями особенно. Так как авторы приносят свой мусор, редакторы 30% убирают, 10 добавляют + у каждого свои замечания.
Короче есть я написал себе макросов предварительной обработки, убирающие весь мусор из текста, который можно легко вычислить. Составил свою таблицу стилей, причем на английском, для совместимости с другими прогами и отсеивающими совпадениями с русскими стилями Worda, не поленился составить на каждый вид объектов стили заголовков со стилями названий и т.п., добавил к стилям идентифицирующие значки. Вывел в отдельный шаблон, где отражены только мои стили. При вставке текста быстренько запускаю макрос скрытия чужих(могу объяснить почему скрытия, а не удаления) прохожу по тексту назначая нужные мне стили, удаляя видимый мусор и вырезая в отдельные файлы элементы, которые могут некорректно отобразиться в других программах и когда я все это подготовлю я спокойно удаляю удаляемое и скрываю скрываемое

25 Ответ от Alex_Gur 20.06.2012 07:16:14

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

При вставке текста быстренько запускаю макрос скрытия чужих(могу объяснить почему скрытия, а не удаления) .

Почему скрытие, а не удаление?

26 Ответ от aap77 20.06.2012 07:25:08

  • aap77
  • генерал-полковник
  • Неактивен
  • Зарегистрирован: 12.09.2011
  • Сообщений: 925
  • Поблагодарили: 243
  • За сообщение: 1
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Потому что текст чаще не знакомый и если сразу удалить то тогда еще тяжелее понять автора так как слетит и правильное и не правильное оформление текста, а все учебники и статьи не прочтешь, если верстальщик будет читать текст, а не форматирование уже через год можно будет давать нобелевскую премию, но скорее всего отдельную палату в желтом доме

27 Ответ от dron_07 04.06.2014 22:39:59

  • dron_07
  • рядовой
  • Неактивен
  • Зарегистрирован: 04.06.2014
  • Сообщений: 1
  • Поблагодарили: 1
  • За сообщение: 1
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Удалить несколько стилей сразу можно через диалоговое окно "Организатор". В Word 2013 он находится на вкладке Вид -> Макросы.

28 Ответ от Alex_Gur 05.06.2014 08:54:52

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Удалить несколько стилей сразу можно через диалоговое окно "Организатор". В Word 2013 он находится на вкладке Вид -> Макросы.

Интересная возможность! Ненужные стили прекрасно удаляются!

29 Ответ от K&Co 29.07.2014 13:40:10

  • K&Co
  • рядовой
  • Неактивен
  • Зарегистрирован: 29.07.2014
  • Сообщений: 3
  • Поблагодарили: 2
  • За сообщение: 1
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Всем доброго времени суток.

Скажу сразу. что в обрабатываемом документе изначально было более 600 стилей. Так что в ручную я его точно не хотел обрабатывать.

При запуске макроса, у меня Word 2013 просто выпал. Думаю, что из-за слишком долгой обработки. Но при втором запуске всё прошло успешно.

Удачного всем использования.
И, несомненно, спасибо автору.

30 Ответ от Alex_Gur 29.07.2014 14:01:21

  • Alex_Gur
  • Модератор
  • Неактивен
  • Откуда: Москва
  • Зарегистрирован: 28.07.2011
  • Сообщений: 2,758
  • Поблагодарили: 492
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Всем доброго времени суток.

Нашёл решение тут: внешняя ссылка

Скажу сразу. что в обрабатываемом документе изначально было более 600 стилей. Так что в ручную я его точно не хотел обрабатывать.

При запуске макроса, у меня Word 2013 просто выпал. Думаю, что из-за слишком долгой обработки. Но при втором запуске всё прошло успешно.

Удачного всем использования.
И, несомненно, спасибо автору.

Большое спасибо! Очень интересный макрос!
Правда, он заканчивается у меня с ошибкой "Run-time error 4198", но все ненужные стили этот макрос успешно удалил!

Было бы очень интересно, если бы кто-нибудь прокомментировал этот код:

31 Ответ от K&Co 30.07.2014 05:33:06

  • K&Co
  • рядовой
  • Неактивен
  • Зарегистрирован: 29.07.2014
  • Сообщений: 3
  • Поблагодарили: 2
  • За сообщение: 1
Re: Как удалять стилевой мусор не поштучно, а за один приём?

Суть данной части проста: ищется подстрока к которой применён текущий (в цикле) стиль.

Говорит, что мы ищем по всему содержимому текущего документа

Что имя стиля для текущего фрагмента совпадает с искомым.

Что мы ищем отформатированную подстроку с нулевой длинной

Если такую строку не нашли, то считаем, что стиль не используется и удаляем его

Как удалить метаданные из документов Word: 3 способа

Как удалить метаданные из документов Word: 3 способа

Всякий раз, когда мы создаем, открываем или сохраняем документ Microsoft Word, в нем записывается дополнительная информация, называемая метаданными. То же самое можно сказать о файлах Microsoft Excel и Microsoft PowerPoint. В определенных ситуациях эти метаданные могут выдать нежелательную информацию о нас и скомпрометировать.

Хотя метаданные и хранятся в неявном виде, ничего криминального в них нет. Они облегчают организацию, хранение, поиск документов, помогают понять их происхождение и назначение. Но бывают такие случаи, что мы не хотим раскрывать имя автора документа, дату создания или редактирования, отправляя файл Word другому человеку.

Чтобы предотвратить возможные неприятные последствия, надо научиться удалять метаданные. Кто знает, в какие руки попадет документ Word с моей фамилией и инициалами, наименованием организации и даже именем компьютера.

Здесь я расскажу о трех способах удаления метаданных из документов Word.

1. Используем встроенные возможности Word / Excel / PowerPoint

Если вы используете Word 2010 или 2013 (Office 2013), то скрытую информацию о себе можно удалить в Инспекторе документов. На вкладке Файл в переходим в раздел Сведения. В группе Подготовка к общему доступу нажимаем на Поиск проблем -> Инспектор документов. Запускаем проверку в Инспекторе документов.

После завершения проверки появится окно с опциями удаления информации. Рядом с «Свойства документа и персональные данные» нажимаем кнопку «Удалить все».

2. Приложение Document Metadata Cleaner

Document Metadata Cleaner — это бесплатная утилита для удаления метаданных из документов Microsoft Word, Excel или PowerPoint. Данное приложение умеет затирать в них фамилию, инициалы, название организации, имя компьютера, имя сетевого сервера или жесткого диска (в зависимости от того, где хранится файл), фамилии предыдущих авторов документа, информацию об изменениях и версиях документа, скрытый текст или ячейки (Excel), комментарии.

3. Программа Doc Scrubber

Doc Scrubber — это еще один бесплатный инструмент анализа и удаления скрытой информации, которая потенциально может скомпроментировать нас. У Doc Scrubber есть два режима работы — в первом он извлекает из документов всю скрытую информацию и показывает ее, а во втором — удаляет метаданные из выбранного документа или группы документов, собранных в одной папке.

Существуют также платные утилиты, помогающие удалить метаданные из документов. Но нужны ли они нам?

3 способа очистки файлов MS Word от разметки Trados или Wordfast

MS Word дает возможность получения работ в двух из этих видах. Ниже привожу скриншот неочищенного файла и очищенного. Обращаю ваше внимание, что для отображения разметки в неочищенном файле необходимо включить функцию «Отображение скрытого текста» (значок ).

Соответственно очищенный вариант данного фрагмента будет:

Итак, для подготовки очищенного варианта используются три способа.

I. Стандартный: Очистка с помощью Trados Workbench
Порядок действий:
— запускаем Trados Workbench;
— запускаем модуль очистки через Tools>Clean Up. ;

— в диалоговом окне выбираем файл(ы) для очистки, устанавливаем необходимые опции (напр. добавить очищенные сегменты в базу данных — Update TM), и нажимаем Clean Up;

— в результате получаем очищенный файл с расширением DOC, старую версию файла, сохраненную с расширением bak, и обновленную базу переводов (Translation Memory).
II. Обходной: Очистка с помощью макроса Trados Workbench
— запускаем MS Word;
— вызываем перечень макросов через Сервис>Макрос>Макросы (комбинация клавиш ALT + F8);
— выбираем макрос под названием tw4winClean.Main и жмем кнопку «Выполнить»;
— через пару секунд получаем очищенный файл (желательно его сохранить под другим именем).

III. Против лома нет приема!

— запускаем MS Word;
— вызываем диалоговое окно «Найти и заменить» (комбинация клавиш CTRL + H);

— в диалоговом окне нажимаем кнопку «Больше» — получаем две дополнительные кнопки «Формат» и «Специальный»;

— устанавливаем курсор в поле «Найти»
— выбираем «Формат» > «Шрифт. », в открывшемся диалоговом окне устанавливаем флажок «Скрытый», жмем «ОК»

— получается в итоге следующее диалоговое окно, в котором остается нажать только «Заменить все».

Надеюсь, эти способы помогут вам избежать любых затруднений при очистке даже самых сложных и «глюкавых» файлов.

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *