Вот история: (Вы можете пропустить этот и следующий пункт в случае, если вы не заботитесь об истории)
Я студент университета, работая на большом (ну, это большое для студента) проект: она включает в себя тиражирование существующих исследований и пытаются прийти к подобным (или, может быть, нет?) Выводов. Всякий раз, когда это возможно один пытается сделать некоторые улучшения. Мы свободны делать то, что мы хотим, до тех пор, как это связано с нашей области исследований. Очевидно, что я хотел сделать что-то с Bitcoin (или cryptocurrencies в целом). Учитывая, что моя степень распологает себя в конъюнктуре финансового и информатики это должно было быть финансирование связанных, а также.
Вы можете быть в курсе довольно много исследований, что было сделано при попытке предсказать цену Bitcoin на основе всех видов источников данных. Часто один пытается связать его с ЭМГ-теории. Я пытаюсь сделать что-то подобное. Более конкретно я пытаюсь повторить некоторые исследования с участием анализа настроений и применить его к Bitcoin. Кроме того, я стараюсь улучшить источники данных, которые были использованы (до сих пор: не так много, по моему скромному мнению). Например. Я буду стараться включать настроения китайских источников новостей. Другое дело, что я заметил, что я никогда не сталкивался с такой бумагой, которая включала Bitcoin форум. Я могу ошибаться, но мне кажется, что если кто-то знает, что будет с Bitcoin (и его стоимость), (s) он, вероятно, здесь активно.
В заключение: Я хотел бы провести анализ настроений на (среди других) темы этого форума. Идея этого поста, чтобы получить некоторый входной сигнал (от администраторов, модераторов или кто что имеет некоторое сходство с темой) о том, как сделать это. А именно я должен был бы копию всех общедоступных сообщений (или, может быть один конкретный совет), так что я могу обрабатывать его легко. Я знаю, что существуют различные способы, чтобы попытаться достичь этого:
- Wget весь сайт
- использовать существующие инструменты для соскабливания PhpBB форумов
- код скребком сам
- спросить очень приятно, чтобы получить резервную копию базы данных
Хотя, возможно, я мог бы попробовать все из них и выяснить, что лучше работаю (или то, что не работает), я сначала хотел бы попросить ваш вход, прежде чем я тратить много времени, пропускную способность и терпение администрации.
Поэтому ввод о том, как это сделать технически, юридически (например, то, что я могу и не делать), социально (например, кто из админов я должен спросить) ... очень приветствуется. Кроме того, если вы хотите обсудить сам проект: пожалуйста, не стесняйтесь (не уверен, если это нарушает «нет вне темы правил ответа»).
Благодаря!