Техническое - скачивание статей с АШ.

Аватар пользователя Рева RarogCmex Денис

Я время от времени сохраняю статьи для своей собственной библиотеки ценных данных, поскольку так хранить много надежнее, чем в виде ссылки. Делать это вручную надоедает,  да и получается грубо и неэстетично, поэтому возникла идея добавить возможность скачивания статей с АШ в .doc , .odt , .fb2 или по крайней мере в .pdf формате. Автоматически  устанавливая авторство и подставляя ссылки на исходную статью в начало и в конец документа и, если возможно, дополняя существующими на момент скачивания комментариями к статье.

Голосование на реформале

http://aftershock.reformal.ru/proj/aftershock?ia=1082670

Плюсы:

1. Надежность сохранения информации повышается.

2. Некоторые статьи удобнее читать в виде документа.

Нейтраль:

  • Удобство копирования с АШ повышается.  Как плюс, так и минус.

Минусы: 

---

 

Авторство: 
Авторская работа / переводика
Комментарий автора: 

Прошу камрадов подсказать по организационной части.

Комментарии

Скрытый комментарий GoldenWorm (c обсуждением)
Аватар пользователя GoldenWorm
GoldenWorm(11 лет 3 месяца)

какие странные у людей бывают хобби surprise

Аватар пользователя Рева RarogCmex Денис

Это работа для себя.

Аватар пользователя Ярик FantomI
Ярик FantomI(8 лет 8 месяцев)

Фсё брехня! Я, как и другие камрады на АШ, сохраняю значимые статьи на флешке и др носителях. ;-)

Аватар пользователя Нехороший
Нехороший(7 лет 11 месяцев)

Не надо. Для браузеров есть расширения, позволяющие сохранять страницы в pdf, например. Не говоря о том, что всегда можно просто сохранить как html. Но было бы неплохо иметь вариант отображения страницы для печати.

 
Комментарий администрации:  
*** Отключен (розжиг, провокатор, горы инфомусора) ***
Аватар пользователя done
done(6 лет 8 месяцев)

расширение на браузер PrintFriendly позволяет легко и быстро сохранить статью в PDF. существенный минус в том, что не видит комменты, а только статью. 

люто поддерживаю предложение автора. 

Аватар пользователя iUser
iUser(9 лет 9 месяцев)

дел


 

Аватар пользователя PigPog
PigPog(12 лет 2 месяца)

https://chrome.google.com/webstore/detail/print-friendly-pdf/ohlencieiip...

Для хрома, позволяет редактировать страницу и сохранять как пдф

Аватар пользователя EdGull
EdGull(8 лет 5 месяцев)

А как сохранить комментарии которые не поместились на первой странице?

Аватар пользователя PigPog
PigPog(12 лет 2 месяца)

К сожалению никак. Или к Алексу, реализовать режим полного просмотра без разбивки на страницы.

Аватар пользователя Рева RarogCmex Денис

Такой режим есть в премиуме (улучшенном аккаунте)

Аватар пользователя alexsword
alexsword(12 лет 6 месяцев)

Это все есть в улучшенном аккаунте.

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

Вот так:

https://aftershock.news/?q=node/625106&full

добавляете к адресу страницы  &full   и будет показана одна "длинная" страница со всеми текущими комментариями.

 

Для браузера Chrome устанавливаете расширение Save as MHT и нажимая на одну кнопочку этого расширения, сохраняете "длинную" html-страницу полностью (со всеми картинками), в одном архивированном файле.  Firefox страницы такого формата тоже показывает корректно.  И уже не особо нужны форматы pdf, docx, fb2 и пр.

 

 

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

По мне бинарный mht — бяка.
И какие гарантии, что его вскорости не постигнет судьба chm?

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

1) Формат mht -- не совсем бинарный. Там подвергаются сжатию лишь "медийные" элементы, но не текст.   Файл формата mht -- открывается в MS Word, FBReader, в различных популярных браузерах самых последних версий.

2) Формат mht является расширением формата html.  Он не является проприетарным "закрытым" форматом, в стороне от мэйнстримовых форматов, и имеет  уже далеко не последнюю версию обновлений и постоянной поддержки многими популярными приложениями (браузерами, развитыми текстовыми и html-редакторами, текстовыми "читалками").
В удобстве пользования и хранения данных этот открытый текстово-графический, html-образный формат практичнее, чем, например, pdf ("закрытый", приприетарный). Из расширенного текстового в pdf конвертировать можно легко, а вот обратно -- проблематично.

 

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

Терминологическое замечание: Вы пробовали открывать файлы в формате mht в каком-нибудь текстовом *редакторе* (например vi)?

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

Пробовал. И в vim, и в wordpad тоже.   Вы там прилагательное "развитый редактор" заметили ? smiley

 

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

С каких интересно пор вордпад стал текстовым *редактором*?

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

Всегда был, с момента создания.  Plain-текстовый редактор.

 

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

Википедия — это такая замечательная штука…
Не подскажете: как мне в текстовом *редакторе* (!!!), например ed, включить убогонькое, не дотягивающее до «полноценного текстового процессора» форматирование текста… например курсивом?

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

Не подскажете: как мне в текстовом *редакторе* (!!!), например ed, включить убогонькое, не дотягивающее до «полноценного текстового процессора» форматирование текста… например курсивом?

Откройте текст из файла в формате *.txt в редакторе vi.
Вставьте тэги для "итализации" фрагмента текста в каком-нибудь "обогащенном" текстовом формате, например, rtf. Или напишите аналогичную по форме последовательность команд обработки текста в файле *.txt в редакторе ed
Сохраните текст в файл с соответствующим расширением *.rtf.

В редакторе ed Вы форматирование текста не "увидите", это не экранный редактор, а строковый.

 

Аватар пользователя И-23
И-23(8 лет 7 месяцев)
Откройте текст из файла в формате *.txt в редакторе vi. Вставьте тэги для "итализации" фрагмента текста в каком-нибудь "обогащенном" текстовом формате, например, rtf. Или напишите аналогичную по форме последовательность команд обработки текста в файле *.txt в редакторе ed. Сохраните текст в файл с соответствующим расширением *.rtf.

Замечательно. Но вопрос не в том, как *вставить* тэги, в а том, как наличие/отсутствие упомянутых тэгов отразится на *отображении*.

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

1.  Какой именно "текстовый" формат имеется ввиду ?   
Например, "итализация" текстовых фрагментов в форматах *.html и *.rtf --- различна.

2. Какое приложение будет отображать "обогащенный" текстовый формат ?   
Если это, например, "развитый" текстовый процессор MS Word, то он в состоянии отобразить на экране и *.html и *.rtf форматы. \

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

Приложение… например *никакое* (то есть cat).

И Вы совершенно напрасно смешиваете *отображение* и *интерпретацию*.

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

Приложение… например *никакое* (то есть cat).

Гм. С каких пор cat перестал быть приложением ?
 

И Вы совершенно напрасно смешиваете *отображение* и *интерпретацию*.

Не смешиваю.  "Отображение" происходит в конечном итоге на экране.  Для "интерпретаций" никаких "отображений" не требуется.


P.S. Зачем Вам вся эта "казуистика" ?

 

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

Наверное с тех пор, когда Вы говорили не просто о приложении, но о приложении, отображающем текст.

При *отображении* на экран выводятся *все* символы текста.
При *интерпретации* некоторые из символов не отображаются, а используются в качестве описания формата отображения текста (всего или части).

Заодно, для лучшего понимания сути роазличия между текстовыми *редакторами* и *процессорами*: не подскажете ли как в Word'е включить подсветку синтаксиса… например POSIX shell?

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

Наверное с тех пор, когда Вы говорили не просто о приложении, но о приложении, отображающем текст.

Здравствуйте.  Тут вообще-то с самого начала говорилось исключительно об приложениях, отображающих тексты на экранах в WYSIVIG.
 

При *интерпретации* некоторые из символов не отображаются, а используются в качестве описания формата отображения текста (всего или части).

При *интерпретации* текста его фрагменты (лексемы и семантические предложения) -- интерпретируются (обычно в исполняемые инструкции, которые затем и исполняются).
Различные командные процессоры различных shell, командный процессор perl, java-машины --- это примеры приложений-интерпретаторов.   Вы подаете приложениям-интерпретаторам на вход текстовый файл с языковыми конструкциями, а приложение-интерпретатор их "разбирает"+"исполняет" (т.е. "интерпретирует").  

 

Заодно, для лучшего понимания сути роазличия между текстовыми *редакторами* и *процессорами*: не подскажете ли как в Word'е включить подсветку синтаксиса… например POSIX shell?

Зачем !?   Зачем офисному текстовому редактору подсвечивать тексты программ ?   Ни программы на POSIX shell, ни программы на других языках высокого уровня и пр. --- MS WORD и не брался "подсвечивать".   
Да и в структурах различных программных языков изначально не предусматривалось директив/тэгов для экранных "подсвечиваний" !   
Такие "подсвечивания" выполняют специализированные программные редакторы, которые при открытии файлов сначала разбирают ("парсят") входной текст, пытаясь "распознать" (а не "интерпретировать") все языковые конструкции программы на том или ином языке и "подсветить их" (имена функций, комментарии, строковые и иные константа и т.д.).

 

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

Здравствуйте,

Возможно *Вы* говорили именно о них.
Я же пытался донести до Вашего понимания тот простой факт, что текстовый *редактор* (в отличие от текстового *процессора*) с принципом WYSIWYG несовместим.
Да и с текстовым процессором, особенно в реализации фирмы майкросовт, бывают сюрпризы.

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

Я же пытался донести до Вашего понимания тот простой факт, что текстовый *редактор* (в отличие от текстового *процессора*) с принципом WYSIWYG несовместим.

Вопрос корректной терминологии. Если бы в миру строго определили понятия "текстовый процессор" и "текстовый редактор", то было бы легче их использовать. 

Но исторически оказалось не так -- часть их свойств в определениях "пересекается" (отчасти тот же WYSIVIG):

WordPad - это текстовый редактор для создания и редактирования документов. В отличие от блокнота, документы WordPad могут содержать различное форматирование и графические объекты, при этом можно вставить объекты (картинки или другие документы) в документ WordPad или связать их с ним.

Microsoft Inc.

 

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

Несомненно.
Но помимо чёткости формальных определений важна и практика их интерпретации.

Майкросовт же, помимо прочего, славен… оригинальными прочтениями впроде бы общеобязательных стандартов.

Аватар пользователя Информатик
Информатик(11 лет 7 месяцев)

Если бы только Microsoft.
За ним и другие начали повторять "размытость" понятия "текстовый редактор". В тех же open source projects (КDЕ, Gnome, ...).

Понятие "интерпретация" в ИТ чаще всего используется в таком смысле, как описал.
 

Аватар пользователя пара валенок
пара валенок(12 лет 3 месяца)

Я обычно запоминаю стаьи с помощью firefox+we addon. Получается толстый html

Аватар пользователя roman.kuvaldin
roman.kuvaldin(12 лет 4 месяца)

Печать, сохранить как PDF, и сохраняй куда угодно. Зачем на сайт добавлять?

Аватар пользователя Рева RarogCmex Денис

Вместе с рекламой и кучей лишнего?

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

В мобильном представлении «лишнего» много меньше.

Аватар пользователя mastersam11
mastersam11(7 лет 2 месяца)

А что тут подсказывать ?
Почти под все языки есть библиотеки / модули, позволяющие генерировать docx / pdf и PHP( если сайт таки сделан на нём ) - тому не исключение.

Технически - добавляется ссылка на странице. При обращении по ней, вызывается соотв. метод, подтягиваются данные из БД и строится документ, который и отдаётся на скачивание.

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

Угу.
Есть у меня опыт работы с такими библиотеками.
При попытке воплощения озвученной декларации Вас ждут сюрпризы.

Аватар пользователя mastersam11
mastersam11(7 лет 2 месяца)

Как сейчас - хз, но, года 3 назад, вордовская приблуда вполне нормально работала( даже вордовский документ как шаблон туда удалось прикрутить )
Единственное, с экселем много заморочек было, но это уже к делу не относится..

Аватар пользователя ДК
ДК(11 лет 6 месяцев)

а какой вордовской вы пользуетесь?

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

«Нормально работала» на каких массивах данных?
Не пробовали создать файлик с табличкой на жалкие несколько десятков тысяч строк?
Рекомендую.

Аватар пользователя Remchik
Remchik(12 лет 2 месяца)

Для Кладовой такую фичу реализовать можно. Для остального не так уж и надо.

P.S. На заметку Alexsword'у - можно в статьях в самом начале поставить ссылку перехода к комментариям? Бывает, что ради комментариев машинально кликнул на статью, которую уже читал и надо либо пролистать ее вниз, либо выходить назад в общий список и кликать на ссылку комментариев в анонсе.

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

s/можно/нужно/

И аналогичным образом (то есть в Кладовую) выложить уже локально, а не на стороннем файлообменнике, подборки товарища Евгения.
Я, помнится, пробовал оформлять, но на завершении корректуры… вдохновение внезапно кончилось.

ЗЫ: Я бы ещё и переструктурировал Кладовую. С учётом народной тектологии («древо познания [Добра и Зла]», но «ткань бытия»).

Аватар пользователя alexsword
alexsword(12 лет 6 месяцев)

Если делать - как общий функционал, без всяких преференций.

Аватар пользователя alterlex
alterlex(10 лет 23 часа)

Я б не отказался от возможности сохранения статей + комментов в fb2.

Комментарий администрации:  
*** Отчислен (словоблудие, оранжизм) ***
Аватар пользователя Рева RarogCmex Денис

Да, fb2 предпочтителен.

Аватар пользователя mastersam11
mastersam11(7 лет 2 месяца)

Чем, если не секрет, столь хорош fb2 на фоне docx / pdf ?

Аватар пользователя Рева RarogCmex Денис

Тем, что специально заточен под электронные книги и масштабируется?

Аватар пользователя mastersam11
mastersam11(7 лет 2 месяца)

В таком случае, речь об абсолютно не_универсальном решении( заточенном именно под читалки )

п.с: к слову, разве тот же пдф не масштабируется ?

Аватар пользователя alterlex
alterlex(10 лет 23 часа)

На читалках масштабируется так коряво, что это жутко неудобно.

Комментарий администрации:  
*** Отчислен (словоблудие, оранжизм) ***
Аватар пользователя Рева RarogCmex Денис

Я имел в виду о перераспределении текста и слов, а не простом увеличении.

Нет, ничуть.

Аватар пользователя И-23
И-23(8 лет 7 месяцев)

Покажите мне пример *масштабируемого* pdf (в смысле *текстового* масштабирования, то есть изменения длины строки в количестве букв).

ЗЫ: Как типо «масштабируются» в режиме просмотра документы в родным форматах мсо мы тоже видели.

Страницы