获取java数组中n个最大值的索引

yvt65v4c  于 2023-04-04  发布在  Java
关注(0)|答案(8)|浏览(166)

我有一个大小为1000的数组。我如何找到五个最大元素的索引(索引)?
下面显示了一个安装代码示例和我的尝试:

Random rand = new Random();
int[] myArray = new int[1000];
int[] maxIndices = new int[5];
int[] maxValues = new int[5];

for (int i = 0; i < myArray.length; i++) {
  myArray[i] = rand.nextInt();
}

for (int i = 0; i < 5; i++) {
  maxIndices[i] = i;
  maxValues[i] = myArray[i];
}

for (int i = 0; i < maxIndices.length; i++) {
  for (int j = 0; j < myArray.length; j++) {
    if (myArray[j] > maxValues[i]) {
      maxIndices[i] = j;
      maxValues[i] = myArray[j];
    }
  }
}

for (int i = 0; i < maxIndices.length; i++) {
  System.out.println("Index: " + maxIndices[i]);
}

我知道问题是它总是给所有最大的元素分配最大的最大值。我不确定如何补救这个问题,因为我必须保留myArray的值和索引。
我不认为排序是一种选择,因为我需要保留索引。事实上,我特别需要的是索引。

rjee0c15

rjee0c151#

很抱歉回答这个老问题,但我错过了一个具有以下所有属性的实现:

  • 易于阅读
  • 表演者
  • 多个相同值的处理

因此,我实现了它:

private int[] getBestKIndices(float[] array, int num) {
        //create sort able array with index and value pair
        IndexValuePair[] pairs = new IndexValuePair[array.length];
        for (int i = 0; i < array.length; i++) {
            pairs[i] = new IndexValuePair(i, array[i]);
        }

        //sort
        Arrays.sort(pairs, new Comparator<IndexValuePair>() {
            public int compare(IndexValuePair o1, IndexValuePair o2) {
                return Float.compare(o2.value, o1.value);
            }
        });

        //extract the indices
        int[] result = new int[num];
        for (int i = 0; i < num; i++) {
            result[i] = pairs[i].index;
        }
        return result;
    }

    private class IndexValuePair {
        private int index;
        private float value;

        public IndexValuePair(int index, float value) {
            this.index = index;
            this.value = value;
        }
    }
56lgkhnf

56lgkhnf2#

排序是一种选择,但需要额外的内存。

1. Allocate additional array and copy into - O(n)
2. Sort additional array - O(n lg n)
3. Lop off the top k elements (in this case 5) - O(n), since k could be up to n
4. Iterate over the original array - O(n)
    4.a search the top k elements for to see if they contain the current element - O(lg n)

所以第4步是(n * lg n),就像排序一样。整个算法是n lg n,代码非常简单。
这里有一个简单的例子,里面可能有bug,很明显,空值检查之类的东西会起作用。
导入java.util数组;

class ArrayTest {

    public static void main(String[] args) {
        int[] arr = {1, 3, 5, 7, 9, 2, 4, 6, 8, 10};
        int[] indexes = indexesOfTopElements(arr,3);
        for(int i = 0; i < indexes.length; i++) {
            int index = indexes[i];
            System.out.println(index + " " + arr[index]);
        }
    }

    static int[] indexesOfTopElements(int[] orig, int nummax) {
        int[] copy = Arrays.copyOf(orig,orig.length);
        Arrays.sort(copy);
        int[] honey = Arrays.copyOfRange(copy,copy.length - nummax, copy.length);
        int[] result = new int[nummax];
        int resultPos = 0;
        for(int i = 0; i < orig.length; i++) {
            int onTrial = orig[i];
            int index = Arrays.binarySearch(honey,onTrial);
            if(index < 0) continue;
            result[resultPos++] = i;
        }
        return result;
    }

}

你还可以做一些其他的事情来减少这个操作的开销。例如,你可以选择使用一个只跟踪最大的5的队列,而不是排序。作为int s,它们的值可能必须被装箱才能添加到一个集合中(除非你自己滚动),这会显著增加开销。

e5nszbig

e5nszbig3#

虽然回答得有点晚,但你也可以使用我写的这个函数:

/**
  * Return the indexes correspond to the top-k largest in an array.
  */
public static int[] maxKIndex(double[] array, int top_k) {
    double[] max = new double[top_k];
    int[] maxIndex = new int[top_k];
    Arrays.fill(max, Double.NEGATIVE_INFINITY);
    Arrays.fill(maxIndex, -1);

    top: for(int i = 0; i < array.length; i++) {
        for(int j = 0; j < top_k; j++) {
            if(array[i] > max[j]) {
                for(int x = top_k - 1; x > j; x--) {
                    maxIndex[x] = maxIndex[x-1]; max[x] = max[x-1];
                }
                maxIndex[j] = i; max[j] = array[i];
                continue top;
            }
        }
    }
    return maxIndex;
}
dced5bon

dced5bon4#

我的想法是使用EvictingQueue,它最多包含5个元素。你必须用数组中的前五个元素预先填充它(以升序进行,所以你添加的第一个元素是五个元素中最低的)。
然后你必须遍历数组,每当当前值大于队列中的最小值时,就向队列中添加一个新元素。为了记住索引,创建一个 Package 对象(一个值/索引对)。
遍历整个数组后,队列中有五个最大值/索引对(按降序排列)。
时间复杂度O(n)

yebdmbv4

yebdmbv45#

sort(myArray),然后取最后5个元素。
如果要保留原始顺序,请对副本进行排序。
如果你想要索引,没有像python或其他语言那样快速而肮脏的解决方案,你可以排序和扫描,但这很难看。
或者你可以使用objecty --这毕竟是java。创建一个ArrayMaxFilter对象。它将有一个私有类ArrayElement,由一个index和一个value组成,并按值自然排序。它将有一个方法,该方法接受一对int,index和value,创建一个ArrayElement,并将它们放入长度为5的优先级队列中。提交数组中的每个索引/值对,然后报告队列中剩余的值。(是的,优先级队列传统上保留最低值,但您可以在实现中翻转它)

hvvq6cgz

hvvq6cgz6#

下面是我的解决方案。创建一个将indice与value配对的类:

public class IndiceValuePair{
    private int indice;
    private int value;

    public IndiceValuePair(int ind, int val){
        indice = ind;
        value = val;
    }
    public int getIndice(){
        return indice;
    }
    public int getValue(){
        return value;
    }
}

然后在main方法中使用这个类:

public static void main(String[] args){
    Random rand = new Random();
    int[] myArray = new int[10];
    IndiceValuePair[] pairs = new IndiceValuePair[5];
    System.out.println("Here are the indices and their values:");
    for(int i = 0; i < myArray.length; i++) {
        myArray[i] = rand.nextInt(100);
        System.out.println(i+ ": " + myArray[i]);
        for(int j = 0; j < pairs.length; j++){
            //for the first five entries
            if(pairs[j] == null){
                pairs[j] = new IndiceValuePair(i, myArray[i]);
                break;
            }
            else if(pairs[j].getValue() < myArray[i]){
                //inserts the new pair into its correct spot
                for(int k = 4; k > j; k--){
                    pairs[k] = pairs [k-1];
                }
                pairs[j] = new IndiceValuePair(i, myArray[i]);
                break;
            }
        }
    }
    System.out.println("\n5 Max indices and their values");
    for(int i = 0; i < pairs.length; i++){
        System.out.println(pairs[i].getIndice() + ": " + pairs[i].getValue());
    }
}

以及运行的示例输出:

Here are the indices and their values:
0: 13
1: 71
2: 45
3: 38
4: 43
5: 9
6: 4
7: 5
8: 59
9: 60

5 Max indices and their values
1: 71
9: 60
8: 59
2: 45
4: 43

我提供的示例只生成了10个int,其值在0到99之间,这样我就可以看到它工作了。您可以轻松地更改它以适应任何大小的1000个值。此外,我没有运行3个单独的for循环,而是在向myArray添加to之后检查我添加的最新值是否是max值。给予它,看看它是否适合您

6rqinv9w

6rqinv9w7#

我建议使用PriorityQueue,它是一个minmax头,复杂度为O(n log k):

private int[] getTopKIndices(double[] array, int num) {
PriorityQueue<IndexValuePair> queue = new PriorityQueue<>(Comparator.comparingDouble((IndexValuePair value) -> value.value));

for (int i = 0; i < array.length; i++) {
    queue.offer(new IndexValuePair(i, array[i]));
    if (queue.size() > num) {
        queue.poll();
    }
}

int[] result = new int[num];
for (int i = 0; i < num; i++) {
    result[num - 1 - i] = queue.poll().index;
}

return result;

}
你也可以使用Google Guava(也是n log k):

import com.google.common.collect.Ordering;    
private static int[] getTopKIndices(double[] array, int num) {
        List<IndexValuePair> pairs = new ArrayList<>();
        for (int i = 0; i < array.length; i++) {
            pairs.add(new IndexValuePair(i, array[i]));
        }

        Comparator<IndexValuePair> valueComparator = Comparator.comparingDouble(value -> value.value);
        List<IndexValuePair> topKPairs = Ordering.from(valueComparator).greatestOf(pairs, num);

        int[] result = new int[num];
        for (int i = 0; i < num; i++) {
            result[i] = topKPairs.get(i).index;
        }

简单地将这些Java实现与Top 10 for 5 Mio条目进行比较,您可以得到:

45411 ms for the solution with simple sorting
1815 ms for the priority queue
2086 ms for the guava solution
q9rjltbz

q9rjltbz8#

简单的O(nlogn)堆解决方案:

public static List<Integer> getTopKIndices(List<Double> scores, int k) {
        Comparator<Map.Entry<Integer, Double>> comparator = Map.Entry.comparingByValue();
        PriorityQueue<Map.Entry<Integer, Double>> heap = new PriorityQueue<>(scores.size(), comparator.reversed());

        for (int i = 0; i < scores.size(); i++)
            heap.add(new AbstractMap.SimpleEntry<>(i, scores.get(i)));
        
        List<Integer> topKIndices = new LinkedList<>();
        for (int i = 0; i < k && !heap.isEmpty(); i++)
            topKIndices.add(heap.poll().getKey());

        return topKIndices;
    }

相关问题