Nowa wersja – Help & Manual 4.4

Help&ManualNajnowsza wersja 4.4 programu Help & Manual jest bezpłatna dla wszystkich użytkowników wersji 4.xx. Zawiera niewidoczne dla użytkownika zmiany uporządkowujące kod aplikacji i usuwające zgłoszone błędy oraz przygotowujące program do przejścia na format XML jako podstawowy format zapisu.

Krótka lista zmian w H&M 4.4:

  • eksport PDF z wieloma referencjami do TOC (spisu treści)
  • import XML z tłumaczeniem
  • przygotowanie do nowego formatu zapisu (XML)
  • naprawa błędów (HTML: obrazki z podpisem w pojedynczej linii są teraz eksportowane ze znacznikiem <div> zamiast <p>; Impict: usunięcie błędu powodowanego zamykaniem powiększonego okna obrazka)

Do pobrania – wersja 4.4, build 1280 (11.10.2007): hmsetup.exe (28 MB)

Jak za pomocą DocxToText pobrać tekst z pliku DOCX

Programista, który potrzebuje indeksować i przeszukiwać dokumenty Microsoft Word *.docx a nie ma zainstalowanego Microsoft Office 2007 ma mały problem. Może go rozwiązać na trzy sposoby:

  • zainstalować MS Office 2007 i użyć jego bibliotek DLL,
  • użyć bibliotek innych dostawców, na przykład „Office Open XML C# Library”,
  • napisać własny kod.

Pisząc własny kod trzeba pamiętać, że Microsoft DOCX przechowuje treść dokumentów w formacie bazującym na XML. Eugene Pankov opisuje szczegółowo, jak napisać własną klasę DocxToText do pobierania treści dokumentów DOCX. Artykuł zawiera przykładowy projekt programu oraz kod źródłowy klasy DocxToText.

Using DocxToText to Extract Text from DOCX Files