Talk:Correlation analysis: Difference between revisions
No edit summary |
|||
(4 intermediate revisions by 2 users not shown) | |||
Line 2: | Line 2: | ||
<br/>-Nej, jag tycker inte det, eftersom det är så kort och direkt relaterat till begreppen korrelationskoefficient och "overlap".[[User:Lars-Ake|Lars-Ake]] 16:07, 1 July 2009 (UTC) | <br/>-Nej, jag tycker inte det, eftersom det är så kort och direkt relaterat till begreppen korrelationskoefficient och "overlap".[[User:Lars-Ake|Lars-Ake]] 16:07, 1 July 2009 (UTC) | ||
::OK, då lägger jag redirekter från TTest etc, men då bör man inte ändra rubriken. [[User:Taxelson|Taxelson]] 20:40, 1 July 2009 (UTC) | ::OK, då lägger jag redirekter från TTest etc, men då bör man inte ändra rubriken. [[User:Taxelson|Taxelson]] 20:40, 1 July 2009 (UTC) | ||
Jag tycker inte att TTest-avsnittet i Wikipedia som vi refererar till är klargörande i det här sammanhanget. | |||
Så varför jaga in läsaren i den artikeln? | |||
<br/>Jag tycker mest att vi skall framhålla metoder för att visa säkerheten i dateringen utan referens till matematisk statistik där man | |||
skall uppfylla vissa statistiska krav på variabler och fördelningar. Speciellt gäller detta när vi använder corrcoeff och TTest på | |||
P2Yrs-variabeln där det saknas utredning om dess egenskaper. [[User:Lars-Ake|Lars-Ake]] 09:51, 4 July 2009 (UTC) | |||
:Javisst. jag var också tveksam till den artikeln. Vi använder ju bara en aspekt av den. Dessutom är det ju så med vår användning av korrelation, att den är mycket ovanlig. I många användningar är man bara intresserade av om det finns en korrelation mellan två kurvor vid en given "passning" (typ rökning/lungcanser eller arbetslöshet/ekonomisk tillväxt eller vad det nu kan vara), medan "sliding" av kurvorna i de flesta sådana sammanhang vore helt meningslös. Så de flesta allmänna statisktikartiklar blir alltför vidlyftiga för våra ändamål. Däremot är det bra att försöka använda vedertagna "variabler", ändrade därför S till σ och gjorde en hänvisning till Expected value sv:Väntevärde, som verkar vara mer specifikt än meanvalue/medelvärde, och för att ge en idé om varför det står "E". [[User:Taxelson|Taxelson]] 10:36, 4 July 2009 (UTC) | |||
== Corina T-value == | |||
http://dendro.cornell.edu/corina-manual/T-Score. Do [[Corina]] use another method for calculation of the T-value, or why do they mention T-values about 2.5-3.0 as good? The normalization method used by Corina is obviously Baille/Pilcher normalization, so according to our experiences (and our way to calculate T-score), at least 6 and probably as high as 8 to be confident would be more true. We really need to analyze the formulas at the corina site to see if they are equivalent to ours. [[User:Taxelson|Taxelson]] 21:47, 4 July 2009 (UTC) | |||
==Confidence interval== | |||
If we accept 0.1% false match towards a 1500 years long reference, that means that the minimum level of t-values we do accept is one random generated (i.e false) match per 1000*(1500-block length) estimated t-values. That is a confidence interval at more than 1-10<sup>-6</sup>. If we instead do accept 1% false matches we still talking about a confidence interval of more than 1-10<sup>-5</sup>, or 99.999%! [[User:Taxelson|Taxelson]] 20:04, 6 July 2009 (UTC) |
Latest revision as of 21:14, 6 July 2009
Kanske TTest-avsnittet borde brytas ut till en egen artikel? Taxelson 12:08, 1 July 2009 (UTC)
-Nej, jag tycker inte det, eftersom det är så kort och direkt relaterat till begreppen korrelationskoefficient och "overlap".Lars-Ake 16:07, 1 July 2009 (UTC)
- OK, då lägger jag redirekter från TTest etc, men då bör man inte ändra rubriken. Taxelson 20:40, 1 July 2009 (UTC)
Jag tycker inte att TTest-avsnittet i Wikipedia som vi refererar till är klargörande i det här sammanhanget.
Så varför jaga in läsaren i den artikeln?
Jag tycker mest att vi skall framhålla metoder för att visa säkerheten i dateringen utan referens till matematisk statistik där man
skall uppfylla vissa statistiska krav på variabler och fördelningar. Speciellt gäller detta när vi använder corrcoeff och TTest på
P2Yrs-variabeln där det saknas utredning om dess egenskaper. Lars-Ake 09:51, 4 July 2009 (UTC)
- Javisst. jag var också tveksam till den artikeln. Vi använder ju bara en aspekt av den. Dessutom är det ju så med vår användning av korrelation, att den är mycket ovanlig. I många användningar är man bara intresserade av om det finns en korrelation mellan två kurvor vid en given "passning" (typ rökning/lungcanser eller arbetslöshet/ekonomisk tillväxt eller vad det nu kan vara), medan "sliding" av kurvorna i de flesta sådana sammanhang vore helt meningslös. Så de flesta allmänna statisktikartiklar blir alltför vidlyftiga för våra ändamål. Däremot är det bra att försöka använda vedertagna "variabler", ändrade därför S till σ och gjorde en hänvisning till Expected value sv:Väntevärde, som verkar vara mer specifikt än meanvalue/medelvärde, och för att ge en idé om varför det står "E". Taxelson 10:36, 4 July 2009 (UTC)
Corina T-value
http://dendro.cornell.edu/corina-manual/T-Score. Do Corina use another method for calculation of the T-value, or why do they mention T-values about 2.5-3.0 as good? The normalization method used by Corina is obviously Baille/Pilcher normalization, so according to our experiences (and our way to calculate T-score), at least 6 and probably as high as 8 to be confident would be more true. We really need to analyze the formulas at the corina site to see if they are equivalent to ours. Taxelson 21:47, 4 July 2009 (UTC)
Confidence interval
If we accept 0.1% false match towards a 1500 years long reference, that means that the minimum level of t-values we do accept is one random generated (i.e false) match per 1000*(1500-block length) estimated t-values. That is a confidence interval at more than 1-10-6. If we instead do accept 1% false matches we still talking about a confidence interval of more than 1-10-5, or 99.999%! Taxelson 20:04, 6 July 2009 (UTC)