# Изменить смайлик HTML для тега
# Удалить а также <\ / Дел>
s / \ (
Я также поступает на выход через этот "СЕПГ -e '/ ^ $ / д'" для удаления пустых строк. После этого, я имел то, что я думал, было довольно полезным, лексемы, один раз "предложение" в каждой строке корпус каждого из счетов в моем опыте. Ручной осмотр корпуса показал, что есть еще какой-то шум там, но самое главное, все запускались корпуса через те же предварительную обработку и лексические скрипты, так что любой шум не будет предвзятыми.
Итак, следующий шаг должен был сделать Ngram отсчеты по каждой из этих моделей. Чтобы сделать это, вы просто подсчитывают все 1, 2 и 3 грамма в корпус и создать файл отсчитывает, который можно использовать для создания моделей языка. Обратите внимание, что я очень рад поделиться этим COUNT файлов для тех, кто хочет их видеть. Дело в том, что я предполагаю, что они слишком велики для большинства Pastebin услуг. Файл рассчитывает quickseller примерно 8MB, например. Я могу очернить их и отправить их всем, кто заинтересован. Или если у кого есть сайт, они не против размещения их на потом, я мог бы послать их к этому человеку. Просто дай мне знать.
tspacepilot @ компьютер: ~ / лм / подсчитываются $ Ls -lah
общая 43М
drwxr-хт-х 2 tspacepilot tspacepilot 4.0K 4 сентября 12:05.
drwxr-хт-х 8 tspacepilot tspacepilot 16K 4 сентября 11:55 ..
-RW-р - r-- 1 tspacepilot tspacepilot 1.3M 3 сентября 10:40 as.count
-RW-р - r-- 1 tspacepilot tspacepilot 16M 4 сентября 8:21 d.count
-RW-р - r-- 1 tspacepilot tspacepilot 12M 4 сентября 8:20 h.count
-RW-р - r-- 1 tspacepilot tspacepilot 617K сен 3 10:41 pan.count
-RW-р - r-- 1 tspacepilot tspacepilot 8.2M 3 сентября 10:38 qs.count
-RW-р - r-- 1 tspacepilot tspacepilot 5.8M 3 сентября 10:40 tsp.count
Следующим шагом является создание модели языка от количества файлов. Я использовал Хорошо литники сглаживания оценки в ОМПЕ параметров для того, чтобы генерировать простые текстовые файлы, которые включают в себя модель. Эти модели в стандартном формате NIST. Вот в верхней части файла из ч.ла:
tspacepilot @ компьютер: ~ / ле / $ головки Пленка tsp.lm
\данные\
Ngram 1: тип = 21218 маркер = 294893
Ngram 2: тип = 117148 маркер = 287741
Ngram 3: тип = 215034 маркер = 280589
\ 1-г:
9787 +0,0331883089798673 -1,4790148753233,
9243 +0,0313435720752951 -1,50385151060555
8592 +0,0291359916986839 -1,53557019528667 в
7152 +0,0242528645983458 -1,61523695785429 s>
7152 +0,0242528645983458 -1,61523695785429
Что вы видите Thereis счетчики для каждого типа Ngram. Таким образом, модель tspacepilot имеет 294893 маркеров / экземпляры слова, которые попадают в 21218 типов. Для того, чтобы быть понятной для тех, кто не имеет опыта работы в этом, если я скажу, "" в два раза, это два маркера и один тип. Затем вы видите начало раздела 1 грамм. Вы можете видеть, что я использовал запятую "," 9787 раз, и что запятая представляет 0,033 ... вероятностную массу модели Юниграммы, второй Colum является то, что масса преобразуется в значение лога. Здесь я повторно Perl-скрипт, который я сделал некоторое время назад. Это достаточно короткий, чтобы показать вам полноту здесь:
#! / USR / бен / Perl
# Строим Ngram LM для данного счета файла
# tspacepilot
использовать строгий;
#setting до входного файла ручки
$ # ARGV! = 1 и умереть "Использование: $ 0 \ п";
мой $ ngram_count_file = $ ARGV [0];
мой $ lm_file_name = $ ARGV [1];
открытый (DATA, "<:", $ Ngram_count_file) || умереть "не может открыть $ ngram_count_file. \ п";
открытый (OUT, ">:", $ Lm_file_name) || умереть "не может открыть $ lm_file_name для записи. \ п";
мой @data = <ДАННЫЕ>;
мой% UNIS;
мои $ uni_toks;
мои% бис;
мой% flat_bis;
мои $ bi_toks;
мои% трисы;
мой% flat_tris;
мои $ tri_toks;
#here мы застроить хэш-таблицы, которые мы будем использовать, чтобы напечатать ответ
Foreach мой $ линии (@data) {
мои @tokens = Раскол (/ \ s + /, $ строка);
мой $ л = $ # лексем;
если ($ л<1) {
Распечатать "ошибка в этой строке граф файла: \ п $ строки \ п";
Распечатать "л = $ л";
} ELSIF ($ л == 1) {
#Распечатать "это Юниграмма \ п";
$ ЮНИС {$ лексемы [0]} = $ лексемы [1];
$ uni_toks + = $ лексемы [1];
} ELSIF ($ л == 2) {
#Распечатать "это биграмм \ п";
$ бис {$ лексемы [0]} {$ лексемы [1]} = $ лексемы [2];
$ flat_bis {"$ лексемы [0] $ лексемы [1]"} = $ лексемы [2];
$ bi_toks + = $ лексемы [2];
} ELSIF ($ л == 3) {
#Распечатать "это триграмма \ п";
$ Трис {"$ лексемы [0] $ лексемы [1]"} {$ лексемы [2]} = $ лексемы [3];
$ flat_tris {"$ жетонов [0] $ жетоны [1] $ лексемы [2]"} = $ лексемы [3];
$ Tri_toks + = $ лексемы [3];
} Еще {
Распечатать "ошибка в этой строке граф файла: \ п $ строки \ п";
Распечатать "л = $ л";
}
}
распечатать "\\ данные \\\ п";
распечатать "Ngram 1: Тип =", Скалярные ключи% ЮНИС," маркер = $ uni_toks \ п";
распечатать "Ngram 2: тип =", Скалярные ключи% flat_bis," маркер = $ bi_toks \ п";
распечатать "Ngram 3: тип =", Скалярные ключи% flat_tris," маркер = $ tri_toks \ п";
распечатать "\\ 1-г: \ п";
Foreach мой $ универ (вид {$ UNIS {$ B} <знак равно> $ UNIS {$ а} или $ а $ CMP B} (ключи% ЮНИС)) {
мои $ = $ Prob UNIS {$ однотонный} / $ uni_toks;
мой $ lgprob;
$ Lgprob = log10 ($ проб);
распечатать "$ UNIS {$ уни} $ $ Prob lgprob $ уни \ п";
}
распечатать "\\ 2-г: \ п";
#compute выход для двух граммов
мой @two_gram_output;
Foreach мой $ flat_bi (ключи% flat_bis) {
мой ($ firstword) = $ flat_bi = ~ т / (\ S +) /;
мой $ знаменатель;
Foreach мой $ secondword (ключи% {$ бис {$ firstword}}) {
$ Знаменателем + = $ бис {$ firstword} {$ secondword};
}
мой $ Пробы = $ flat_bis {$ flat_bi} / $ знаменатель;
мой $ lgprob = log10 ($ проб);
толчок (@two_gram_output, "$ flat_bis {$ flat_bi} $ $ Prob lgprob $ flat_bi \ п");
}
мои @sorted_two_grams = {рода (сплит / \ s + /, $ б) [0] <знак равно> (Сплит / \ S + /, $ а) [0]} @two_gram_output;
#print выход для двух граммов
Foreach (@sorted_two_grams) {
распечатать;
}
#compute выход для 3grams
распечатать "\\ 3-граммы: \ п";
мой @three_gram_output;
Foreach мой $ flat_tri (ключи% flat_tris) {
мой ($ first_two_words) = $ flat_tri = ~ т / (\ S + \ S + \ S +) /;
мой $ знаменатель;
Foreach мой $ thirdword (ключи% {$ трис {$ first_two_words}}) {
$ Знаменатель + = $ {$ трис- first_two_words} {$ thirdword};
}
мой $ Пробы = $ flat_tris {$ flat_tri} / $ знаменатель;
мой $ lgprob = log10 ($ проб);
толчок (@three_gram_output, "$ flat_tris {$ flat_tri} $ $ Prob lgprob $ flat_tri \ п");
}
мои @sorted_three_grams = {рода (сплит / \ s + /, $ б) [0] <знак равно> (Сплит / \ S + /, $ а) [0]} @three_gram_output;
#print выход для 3grams
Foreach (@sorted_three_grams) {
распечатать;
}
суб log10 {
мой $ п = сдвиг;
Возвращение журнала ($ п) / журнал (10);
}
Хорошо, с моделями языка все встроенные (опять же, по электронной почте мне или PM мне, если вы хотите увидеть сами модели, я не против делиться ими), мы можем начать, чтобы добраться до забавного материала. Целью эксперимента является использование модели языка в качестве предсказателей других счетов текстов. Типичная мера для этого называется "растерянность" (
https://en.wikipedia.org/wiki/Perplexity). Один из мельчайших подробно об этом является то, что сортирует взвешивания, чтобы дать 1,2,3 граммовых порций модели при расчете недоумения. Наглядно, поставив больший вес в 1 граммы ставит больше значения на общих одинарных слов, т.е. основного словарного запаса человека. Собираем больше веса на 3-грамм ставит больше веса на том, что человек ставит слова вместе, какие из трех слов фразы, они склонны использовать. Я в конечном итоге с использованием весов 0,3 0,4 0,3 (UNI, Bi, три грамма) при расчете недоумения. Для каждой модели языка, я вычислил недоумение он присваивает каждый из корпусов счетов в эксперименте. А вот забавный материал, то результаты:
Как простой текст, проверяя языковую модель QS против каждого корпуса:
==> qstest-acctseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 2722 Num = 57708 oov_num = +1393
logprob = -119405,183085554 ave_logprob = -2,02254828472914 ППЛ = +105,329078517105
==> qstest-dooglus-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 48667 Num = 827638 oov_num = 108735
logprob = -1963318,24588274 ave_logprob = -2,55783608776103 ППЛ = +361,273484388214
==> qstest-hilariousandco-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 42799 Num = 636455 oov_num = 53676
logprob = -1514039,01569095 ave_logprob = -2,42022420176373 ППЛ = +263,162620156841
==> qstest-panthers52-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = Num = тысяча шестьсот шестьдесят три 25359 oov_num = 1093
logprob = -53775,973489288 ave_logprob = -2,07397020669089 ППЛ = +118,568740528906
==> qstest-tspacepilot-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 7150 Num = 280589 oov_num = 29664
logprob = -666393,992923604 ave_logprob = -2,5821718218487 ППЛ = +382,09541103913
Ну, как вы можете видеть, QS' модель предсказывает мой корпус с недоумением 382, предсказывает Hillarious с 263, предсказывает dooglus с 361. Но самое главное, предсказывает сообщения ACCTSeller и Panthers52 на 105 и 118 !!!!
Что это означает, что QS-то размещает стиль, когда измеряется количественно показывает через его попытки скрыть то, что он делает. Это не удивительно для тех, кто знает, как работает язык, но это может быть другим. Для удовольствия, я тоже побежал каждую модель в качестве предсказателя против каждого из других корпусов.
hillariousancco против всех:
==> htest-acctseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 2722 Num = 57708 = 2260 oov_num
logprob = -136595,372784586 ave_logprob = -2,34820994988114 ППЛ = +222,951269646594
==> htest-dooglus-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 48667 Num = 827638 oov_num = 109662
logprob = -1934327,44440288 ave_logprob = -2,52311368446967 ППЛ = +333,513704608138
==> htest-panthers52-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = Num = тысяча шестьсот шестьдесят три 25359 oov_num = 1828
logprob = -60634,1796607556 ave_logprob = -2,40669126223528 ППЛ = +255,088724501193
==> htest-quickseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 24371 Num = 503617 oov_num = 25750
logprob = -1193959,69530073 ave_logprob = -2,37727869117974 ППЛ = +238,384871857193
==> htest-tspacepilot-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 7150 Num = 280589 oov_num = 26006
logprob = -662995,55023098 ave_logprob = -2,5330988076818 ППЛ = +341,270546308425
Таким образом, мы можем видеть, что Hillarious действительно не имеет стиль предсказывает любого из остальные из нас лучше, чем другие. По крайней мере, не существенно. Тем не менее, это
является Интересно, что Hillarious' модель присваивает недоумения на все трех счетах quickseller, который находится в том же диапазоне. Это обеспечивает наклонное предложение относительно сходства этих корпусов. Вот dooglus' модель прогнозирования каждого из других учетных записей:
==> dtest-acctseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 2722 Num = 57708 = 2518 oov_num
logprob = -141009,183781008 ave_logprob = -2,43488713532615 ППЛ = +272,199382299313
==> dtest-hilariousandco-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 42799 Num = 636455 oov_num = 44764
logprob = -1532563,94318701 ave_logprob = -2,4154264735252 ППЛ = +260,271415205445
==> dtest-panthers52-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = Num = тысяча шестьсот шестьдесят три 25359 oov_num = 1752
logprob = -61358,7835651667 ave_logprob = -2,42812756490569 ППЛ = +267,995538997277
==> dtest-quickseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 24371 Num = 503617 oov_num = 26384
logprob = -1223316,26268869 ave_logprob = -2,43880882666145 ППЛ = +274,668481585288
==> dtest-tspacepilot-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 7150 Num = 280589 oov_num = 20198
logprob = -680500,394458114 ave_logprob = -2,5435368577456 ППЛ = +349,572175864552
вот моя модель прогнозирования всех остальных корпусов
==> ТТЕСТ-acctseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 2722 Num = 57708 = 2850 oov_num
logprob = -139530,390079984 ave_logprob = -2,42324400972532 ППЛ = +264,998862488461
==> ТТЕСТ-dooglus-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 48667 Num = 827638 oov_num = 99717
logprob = -1946265,50900313 ave_logprob = -2,50617510057216 ППЛ = +320,756230152803
==> ТТЕСТ-hilariousandco-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 42799 Num = 636455 oov_num = 50287
logprob = -1518909,27782387 ave_logprob = -2,41492682099994 ППЛ = +259,972147091511
==> ТТЕСТ-panthers52-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 1 663 Num = 25359 = 2043 oov_num
logprob = -61310,1514410114 ave_logprob = -2,45446781060136 ППЛ = +284,752673700336
==> ТТЕСТ-quickseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 24371 Num = 503617 oov_num = 30864
logprob = -1209678,28851218 ave_logprob = -2,43335322477326 ППЛ = +271,239680896164
Наконец, мы можем также использовать модели acctseller и модели Пантеры предсказать другие корпуса. Эти модели немного меньше, чем у модели QS, поэтому я думаю, что это не так впечатляет, как результаты от модели QS. Но они
делать демонстрируют ту же картину.
==> ATEST-dooglus-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 48667 Num = 827638 oov_num = 158655
logprob = -1864342,35403158 ave_logprob = -2,59784345298067 ППЛ = +396,135216494324
==> ATEST-hilariousandco-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 42799 Num = 636455 oov_num = 87812
logprob = -1444217,53179264 ave_logprob = -2,44185825794015 ППЛ = +276,603873729012
==> ATEST-panthers52-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 1 663 Num = 25359 = 2433 oov_num
logprob = -54938,2415881704 ave_logprob = -2,23426091293548 ППЛ = +171,498731827101
==> ATEST-quickseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 24371 Num = 503617 oov_num = 36302
logprob = -1072293,35965131 ave_logprob = -2,18084989129508 ППЛ = +151,652610771117
==> ATEST-tspacepilot-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 7150 Num = 280589 oov_num = 47163
logprob = -623320,832692272 ave_logprob = -2,59095185177354 ППЛ = +389,898758003026
Опять же, dooglus, я и hillariuos все выше 270, тогда как другой известный счет quickseller находится в 151 и "подозреваемый" альт находится в 171. И с моделью Пантеры:
jcrowgey @ цитрусовых: ~ / quickseller / PPL, / Ptest $ хвост -n 3 *
==> Ptest-acctseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 2722 Num = 57708 = 5835 oov_num
logprob = -126943,515020739 ave_logprob = -2,32518573167395 ППЛ = +211,439309416701
==> Ptest-dooglus-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 48667 Num = 827638 oov_num = 200298
logprob = -1733046,66220228 ave_logprob = -2,56365194769031 ППЛ = +366,144021870075
==> Ptest-hilariousandco-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 42799 Num = 636455 oov_num = 110187
logprob = -1420281,45120892 ave_logprob = -2,49580708635173 ППЛ = +313,18942275869
==> Ptest-quickseller-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 24371 Num = 503617 oov_num = 55974
logprob = -1089757,40317691 ave_logprob = -2,30873957801444 ППЛ = +203,582094424962
==> Ptest-tspacepilot-3.4.3.ppl <==
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
sent_num = 7150 Num = 280589 oov_num = 56725
logprob = -602993,466557261 ave_logprob = -2,61020313295844 ППЛ = +407,570866725746
Опять же, модель пантеры на самом деле самый маленький в терминах входных данных, так что вы можете увидеть, как это немного менее надежными по этой причине. Тем не менее, сходство с acctseller корпусом и quickseller корпусом действительно выделяется при сравнении со значениями, присвоенных dooglus, Hillarious и tspacepilot корпусов.
Позволяет суммировать это в таблице:
Как заработать Биткоины?
Без вложений. Не майнинг.
4 сентября 2015, 8:40:10 PM
|
# 3
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Значит ли это, что я глобальный модератор? Если это так, то я буду нуждаться немного подготовки. Надеюсь, QS ответит на эту тему, как только он может отправлять / PM снова для решения ваших проблем. Я не специалист в этом виде анализа, я тем не менее считаю, вам потребуется больший пул пользователей для сравнения. Похоже, вы просто бросали дерьмо на стене, чтобы увидеть, что палочки ты ревнуешь, что quickseller находится в списке трастового по умолчанию, и вы не доказывает, насколько он derserves это и не вы
Я согласен добрый незнакомец, я согласен.
|
|
|
4 сентября 2015, 8:45:29 PM
|
# 5
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Похоже, вы просто бросали дерьмо на стене, чтобы увидеть, что палочки ты ревнуешь, что quickseller находится в списке трастового по умолчанию, и вы не доказывает, насколько он derserves это и не вы
Не правда, у меня есть очень большой корпус текста по счету Quickseller построить модель с. Тот факт, что эта модель подходит текст panthers52 корпуса и acctseller корпуса одинаково хорошо и много, гораздо лучше, чем корпуса других счетов то, что это --->доказательства того, что quickseller писал посты этих счетов. Эксперимент не был бы возможен без большого свода quickseller сообщений и outed АЛТ acctseller только добавляет к результатам. Люди должны смотреть на эксперимент и решить для себя, что это значит. Они также должны принять его в контексте всех других доказательств того, что panthers52 является quickseller. Лично я с нетерпением жду более сложной, чем критики "thowing дерьмом на стене", Но спасибо за ваш вклад! Значит ли это, что я глобальный модератор? Если это так, то я буду нуждаться немного подготовки. Не знаю, как вы придумали это. Уход для разработки? Я не специалист в этом виде анализа, я тем не менее считаю, вам потребуется больший пул пользователей для сравнения.
Не стесняйтесь предлагать изменения в эксперименте. Или просто идти вперед и войти с основным счетом. Вы действительно держать повысит ставку. Готовы ли вы отрицать, что вы альт из Quickseller? Такой уклончивый ответ, в то время как мягко развлекательный, не делает вам никакой пользы в этой точке: Я Panthers52. Я не вижу смысла на свой вопрос. я, будучи ли QS (если это правда) делать какие-либо из моих точек любого менее достоверны?
|
|
|
4 сентября 2015, 9:50:53 PM
|
# 7
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Я думаю, что это действительно интересный анализ, который мог бы помочь с проблемой носка кукол в форумах, если он достиг легитимности здесь. У меня есть вопрос по исправлению. Для индексов, почему ниже лучше? Похоже, что вы используете контент для предсказания других, право одного пользователей сообщений? Или количество общности? Я, как правило, осмыслять это как процент или отношение, как это перевести в цифры индекса вы вычисленные? Что число означает, по отношению друг к другу, они линейный индекс? Ямато имеет право точки? делает все ваш анализ говорит, что их сообщения написаны таким же образом. Вы можете сделать некоторые статистический тест, чтобы показать, насколько велика вероятность, что это просто случайность? например т-тест? Потому что я следую за сообщениями dooglus, я был в ногу с другой нитью в мета. Первоначально я не думаю, что пантера была альт, но когда он не смог следить за этим: ..... Если вы ответить, как ребенок снова, то вы получите только добавил к моему постоянному список игнорируемых, и я навсегда оставить эту тему.
С уважением Panthers52
Я начал мои сомнения. Если этот тип анализа действительно становится полезным инструментом на форуме я вижу много применений, например, при обнаружении продаж счета.
|
|
|
4 сентября 2015, 9:59:09 PM
|
# 8
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
это ничего не доказывает, кроме Panthers52 переговоров в Подобным же образом, как Quickseller.
С уважением не Ямато не Orochi
Я бы сказал, что это достаточно хорошо с точки зрения непрофессионала резюме того, что происходит здесь. Но чтобы быть более конкретным, что это свидетельствует о том, что большая иш statisical модель сообщений quickseller предсказывает посты acctseller и panthers52 одинаково хорошо и signficantly лучше, чем это предсказывает сообщения мне, dooglus или Hillarious. Причина, важно то, что эти виды отношений являются "скрытые в виду" на языке мы используем все время, они не так легко maniuplated. Они построены в течение 1/2 миллиона слов, которые в достаточном количестве разместил на этом форуме. Статистические отношения в этом корпусе позволяют нам смотреть на матчи против других счетов. Я отправил Al код и методы здесь для тех, кто хочет повторить эксперимент или попробовать технику на другие счета или пар известных альтов. Важно также отметить, что это не единственное свидетельство того, что Panthers52 является альт QS в. Там на самом деле Сорта подавляющее количество косвенных доказательств. Я полагаю, что рано или поздно мы услышим от badbear о том, есть какое-либо IP-доказательство. Там также особенности "поставить галочку" что QS и его альтов есть, и, насколько я видел, никакие другие счета не имеют этого. Я не буду говорить, что это такое, потому что это лучше оставить его скрытые в случае QS создает больше альтов. Мои проблемы с Quickseller должны делать с тем фактом, что он был издевательства меня неумолимо почти полгода. Я не ожидал, что я хотел бы раскрыть доказательства его делать условное депонирование аферу. Это произошло на несчастный случай, когда он потянул в другой sockpuppet счет, чтобы попытаться атаковать меня. Я оставляю это для тех, кто торгует с ним и использовать его в качестве эскроу, чтобы решить, является ли это нечестно торговать с кем-то, кто есть альт поставщика условного депонирования.
|
|
|
4 сентября 2015, 10:17:32 PM
|
# 10
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Я думаю, что это действительно интересный анализ, который мог бы помочь с проблемой носка кукол в форумах, если он достиг легитимности здесь.
Это могло бы. Но это будет только полезно, если у вас есть много текста, чтобы начать с. В случае QS», он написал целую Лотта слов .5 миллионов слов не небольшое количество текста. И это особенно полезно, потому что мы имеем известный альт сравнить точность модели с. То есть, это довольно интересно, что модель предсказывает текст acctseller с той же метрикой, как panthers52. Я полагаю, что есть несколько случаев, когда лицо, подозреваемое в мошенническом написало столько, сколько QS. Но вы правы, это может быть полезно. У меня есть вопрос по исправлению.
Для индексов, почему ниже лучше? Похоже, что вы используете контент для предсказания других, право одного пользователей сообщений? Или количество общности? Я, как правило, осмыслять это как процент или отношение, как это перевести в цифры индекса вы вычисленные?
Я думаю, что статья википедии на недоумении является достаточно хорошим местом, чтобы начать https://en.wikipedia.org/wiki/Perplexity. Я не очень хороший учитель, и гораздо лучше, чем прозу я могу производить было написано, чтобы объяснить метрику. Я думаю, что простой способ думать о нем, как кросс-энтропии модели<->Тест-корпус отношения. Вот еще один веб-страница, которая говорит об этом, и как она используется для прогнозирования текста. http://itl.nist.gov/iad/mig/publications/proceedings/darpa98/html/lm30/lm30.htmЧто число означает, по отношению друг к другу, они линейный индекс?
Она должна быть более или менее линейным. Ямато имеет право точки? делает все ваш анализ говорит, что их сообщения написаны таким же образом. Вы можете сделать некоторые статистический тест, чтобы показать, насколько велика вероятность, что это просто случайность? например т-тест?
Можно, конечно, вычислить Pearsons г на матрицу я предоставил. У меня также есть интуиция, что Т-тест может быть уместным. Но это не для меня ясно, на данный момент, как настроить параметры. Может быть, кто-то умнее меня будет забрать это и / или описать, как Т-тест будет работать в данном конкретном случае. Если этот тип анализа действительно становится полезным инструментом на форуме я вижу много применений, например, при обнаружении продаж счета.
Как я уже говорил выше, я сомневаюсь, что это стало бы вообще полезно, если люди в вопросе не имеют большое количество сообщений. Наличие большого количества данных, чтобы начать с делает лучшую модель. Вы не могли бы использовать это на NEWB счетах.
|
|
|
4 сентября 2015, 10:19:51 PM
|
# 11
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Вы обязательно должны написать это в программу и поставить ее в сфере услуг или разработки проекта. Было бы здорово, для анализа на поиск альтов людей, а не только quickseller. На самом деле, может быть quickseller сам мог бы даже использовать его.
Отличная идея! Тогда люди могут делать другим то, что tspacepilot претензии quickseller сделал к нему, обвинять без твердых доказательств, только предположения, основанные на том, что говорят другие, или в этом случае, скрипт / алгоритм или что вы хотите назвать это. Нет? Не принимая сторон здесь. Я был бы шокирован, что quickseller депонируются для себя? Нет, я видел другие высокопоставленные члены сделать это.
|
|
|
4 сентября 2015, 10:26:29 PM
|
# 12
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Вы обязательно должны написать это в программу и поставить ее в сфере услуг или разработки проекта. Было бы здорово, для анализа на поиск альтов людей, а не только quickseller. На самом деле, может быть quickseller сам мог бы даже использовать его.
Отличная идея! Тогда люди могут делать другим то, что tspacepilot претензии quickseller сделал к нему, обвинять без твердых доказательств, только предположения, основанные на том, что говорят другие, или в этом случае, скрипт / алгоритм или что вы хотите назвать это. Нет? Было бы хорошо, базовый уровень, чтобы начать с. Вместо того, чтобы пытаться охотиться и искать доказательства того, что не может даже существовать, было бы по крайней мере, предоставить кому-то с чем-то работать прочь. Это было бы по крайней мере показать, что это возможно для двух счетов, чтобы быть альтами для дальнейших исследований, а не идти непосредственно к поиску blockchain доказательств, которые могут занять очень много времени. Такая программа также будет полезна для просмотра, был ли продан счет и примерно когда.
|
|
|
5 сентября 2015, 1:03:50 AM
|
# 13
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Я знаю, что ч.л. с момента, когда он создал бесполезные темы чья точка немного больше тогда лучше тогда наиболее завуалированной попыткой повысить свой пост счет. Нить была о нем претендующем на сделку, которая не подтверждала бы в течение нескольких дней, я пытался дозвониться ему на это существо BS, и он в конце концов дал мне a5e169d60a797e4585c299cfa8bd2aff457f4d80a5b0c70e0f467e35fd21e1ad, который был передан ~ часа до его подтверждения, и подтверждения в блоке, был найдено дни после того, поток был создан Я довольно уверен, что это была сделка по себе в качестве прикрытия для создания нити, однако я не думаю, что у меня было достаточно убедительных доказательств того, чтобы создать мета-нить о бессмысленной нити. По какой-то странной причине, ч.л подумал, что он хотел, чтобы опубликовать в своей теме о QS, и как только я сделал, он утверждал, что я был QS и начал пылать меня. Единственная причина, я могу думать, что ч.л. хотел, чтобы опубликовать его нить о QS, потому что я не согласен с ним, желая сделать доверие система изменилась, поэтому было бы проще кинуть и легче доверие фермы. Из того, что я могу видеть, ч.л собирается троллить кого в течение нескольких месяцев, кто не согласен с ним, и в результате я предложил бы кто-нибудь читает это, чтобы не дать никаких оснований утверждать, что ч.л. неправильно в этой теме или любой другой. Если вы не согласны с чайной ложки, то приготовьтесь к контролируемому и преследованиям в течение нескольких месяцев по нему, в том числе от потенциального носка-марионетки.
|
|
|
5 сентября 2015, 1:15:30 AM
|
# 14
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
FUD
^^^ все еще продолжается. Дать странный бред о каком-то посте или нити, которая предназначена, чтобы отвлечь и вызвать путаницу. Если вы не можете обработать сообщение, атаковать гонец. Вы все больше и больше отчаянным с этим рода махинаций. Я люблю, как Сорта, как его эмоциональный уровень происходит через крышу, его попытка скрыть свое поведение, как quickseller бы Сорт отпал полностью. Quickseller, больше на теме здесь было бы подтвердить или опровергнуть, что panthers52 ваш альт. Apparantely, он может даже не быть проблемой: Не принимая сторон здесь. Я был бы шокирован, что quickseller депонируются для себя? Нет, я видел другие высокопоставленные члены сделать это.
Я не торгую здесь, так что я не знаю, что считается честным / нечестным. Моя интуиция, что предполагает использовать себя в качестве эскроу нечестно, но я оставляю это сообщество, чтобы решить.
|
|
|
5 сентября 2015, 1:40:56 AM
|
# 15
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Выполните сценарий на этот счет по сравнению с turtlehurricane. Это не имеет никакого смысла делать. Этот счет имеет 13 сообщений. Это нигде не рядом достаточно данных, чтобы получить целостный образец. Нам нужно больше точек данных, люди не принимают это всерьез, потому что ваши эксперименты отсутствуют. Вы получили код построен, теперь сделать некоторые исследования!
Люди могут сделать свои собственные выводы. Я думаю, что сравнение модели quickseller в качестве предсказателя трех классов было довольно информативно. Эти три класса (1) известный альт; (2) подозреваемый альт; (3) люди, которых мы знаем, не его альт. Данные, которые я представил, показывают, что подозреваемый альт и известный альт прогнозируются одинаково хорошо и намного лучше, чем люди, которых мы знаем, не его альт. Они другие модели обеспечивают контекст, прогнозируя посты другого человека с моделью, которая не является их вы в конечном итоге с недоумением от 250--400. Когда мы использовали модель quickseller, чтобы предсказать, текст его альтов, мы получили недоумение около 100-150. Мы могли бы настроить параметры модели, и мы могли бы работать более experments. Я рад помочь кому-то еще, чтобы сделать это, но у меня нет времени или ресурсов, чтобы ничего не делать, но запускать модели в течение всего дня. Более того, кажется, что QS отказался даже пытаться защищаться здесь. Если panthers52 не был его альт, не первое, что он действительно будет сказать "Неа", Вместо этого он говорит, что это: Я Panthers52. Я не вижу смысла на свой вопрос. я, будучи ли QS (если это правда) делать какие-либо из моих точек любого менее достоверны?
|
|
|
5 сентября 2015, 1:56:25 AM
|
# 16
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Люди могут сделать свои собственные выводы. Я думаю, что сравнение модели quickseller в качестве предсказателя трех классов было довольно информативно. Эти три класса (1) известный альт; (2) подозреваемый альт; (3) люди, которых мы знаем, не его альт. Данные, которые я представил, показывают, что подозреваемый альт и известный альт прогнозируются одинаково хорошо и намного лучше, чем люди, которых мы знаем, не его альт. Они другие модели обеспечивают контекст, прогнозируя посты другого человека с моделью, которая не является их вы в конечном итоге с недоумением от 250--400. Когда мы использовали модель quickseller, чтобы предсказать, текст его альтов, мы получили недоумение около 100-150.
Мы могли бы настроить параметры модели, и мы могли бы работать более experments. Я рад помочь кому-то еще, чтобы сделать это, но у меня нет времени или ресурсов, чтобы ничего не делать, но запускать модели в течение всего дня. Более того, кажется, что QS отказался даже пытаться защищаться здесь. Если panthers52 не был его альт, не первое, что он действительно будет сказать "Неа", Вместо этого он говорит, что это:
Кто-то принес бы это рано или поздно, так что я предполагаю, что теперь будет, и вы можете получить его из пути. - "Принудительный 3 дневный перерыв с форума Возвращайся субботу", Эта нить была создана сегодня. Кстати, доносчик может и, скорее всего, использовать несколько стилей проводки. Ваши алго могли бы сделать другие члены считают, что они имеют дело с кем-то не альтов. Алго также может быть неправильными и флагом кто-то, как мошенник, когда они просто разместить похожи на мошенник, или Мошенник изучал их историю проводки и решил скопировать его. Доносчик может претендовать один и тот же: Установка альт, должность, как правило, афера и когда поймано сказать кто-то скопировал его. Вряд ли, но с течением времени возможно. Это может привести либо мошенник деться или не скамминг того его репутация испорчена. Что за минуту, что отчасти напоминает мне о недостатках в списке доверия по умолчанию несколько членов держать вернуть его. Еще раз, не принимая сторону здесь. Я просто указывая на недостатки. Алго довольно прохладно, но, как представляется, нужно гораздо больше работы, и даже тогда может быть неправильным, в результате чьей-то репутации получать разрушила или кто-то деться. То же, как и сейчас. Так что на самом деле ничего не изменилось.
|
|
|
5 сентября 2015, 3:16:02 AM
|
# 20
|
Цитировать по имени
цитировать ответ
|
Re: Quickseller escrowing для себя
Кто-то принес бы это рано или поздно, так что я предполагаю, что теперь будет, и вы можете получить его из пути. - "Принудительный 3 дневный перерыв с форума Возвращайся субботу", Эта нить была создана сегодня. Так как именно он собирается защищать себя в этой теме? Кроме того, что он здесь. Даже он не отрицает. Он просто Сорта размещения вне тему нонсенса в порядке отвлекает. Кстати, доносчик может и, скорее всего, использовать несколько стилей проводки. ... На самом деле, суть этого эксперимента состоит в том, что это не та вещь, которую вы можете манипулировать с сознательным мозгом. Для того, чтобы управлять этими моделями, Вы должны были бы сделать это через сотню тысяч слов. Это довольно ясно для всех, кто читает сообщения panthers52 и quickseller, что он сделал сознательное усилие, чтобы замаскировать его "стиль проводки", Но как только вы измеряете "стиль проводки" в более конкретной форме, шарада разваливается. Другое дело, иметь в виду, я не утверждаю, что люди отключить свои мозги и subsitute свои рациональные мысли с результатами этого эксперимента. Я представил результаты эксперимента, потому что я думал, что они освещали интересный свет на парне, который, кажется, действуют довольно shadily (не только в его использовании виртуалов ради аргумента), но в обеспечении себя депозитные услуги без его торговых партнеров, зная об этом , Я не прошу, чтобы стать новым тираном, я просто предоставление информации. Который, apparantely, даже значения Quickseller: Это также пример, как к ценности информации, ...
|
|
|