+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

Python scipy chi2_contingency用法

发布于2020-10-11 09:32     阅读(1028)     评论(0)     点赞(26)     收藏(3)


0

1

2

3

4

5

您好,

在尝试使用scipy chi2_contingency函数时遇到一些问题

需要明确的是,我想测试两个变量的独立性。我有两个文件,它们包含相同数量的标记(从0到20),我提到的两个变量是从这些文件中提取的。
为此,我将这样进行:

data1 = np.array(datalist1)
data2 = np.array(datalist2)
if(len(data1) == len(data2)) :
    bins1 = np.arange(0, 20.001, 20/nbclasses1)
    bins1[len(bins1) - 1] += 1
    data1, bins1 = np.histogram(data1, bins1)
    bins2 = np.arange(0, 20.001, 20/nbclasses2)
    bins2[len(bins2) - 1] += 1
    data2, bins2 = np.histogram(data2, bins2)
    data = [data1, data2]
    chi2, pvalue, dof, a = chi2_contingency(data)
    # valeur du chi2
    self.statdetest_val.config(text = chi2)
    self.valcrit_val.config(text = pvalue)
    if(seuil_alpha > pvalue) :
        #null hypothesis rejected -> dependence 
    else :
        #null hypothesis accepted -> independence


因此,我试图通过将值重新分组为类来测试两个变量之间的独立性(如果我想要20个类,则将具有0至1级,1至2级,...)。对于每个类,我计算内部的值数,并得到一个包含每个类的标记数的数组。
但是,当我为两个变量选择许多不同的类时,chi2_contingency函数内部出现错误

我认为我不太了解如何使用此功能,因此也许有人可以向我解释为什么我的工作无效?而且您认为我想做的事是可能的吗?
预先感谢!


解决方案


暂无回答

0

1

2

3

4

5

6

7

8



所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接: https://www.pythonheidong.com/blog/article/575168/2a15f82b7526d1cd445d/

来源: python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

26 0
收藏该文
已收藏

评论内容:(最多支持255个字符)